Python——如何避免无法解码的数据读取

 

工作中,线上数据可能存在一些utf-8无法解码的符号,应该如何利用python读取?

解决方案:新增参数 errors="ignore"

with open("demo.txt", "r", encoding="utf-8", errors="ignore") as file:
    for line in file:
        print(line)

API文档可以看下:菜鸟教程——Python3 open() 函数

 

当然,部分朋友可能会说

  • 使用try ... except ...也可以,确实是的,但不够简洁。
  • 使用iso-8859-1编码格式,再转化成utf-8,确实也可以,但这个也比较麻烦。

 

其他参考文章

  • 关于with open() as f读取文件时编码报错问题

更多推荐

Python——如何避免无法解码的数据读取