【发布时间】:2014-04-22 22:23:30
【问题描述】:
我有一个带有BOM 的UTF-16 LE 文件。我想将此文件翻转为不带 BOM 的 UTF-8,以便我可以使用 Python 对其进行解析。
我使用的常用代码没有解决问题,它返回未知字符而不是实际文件内容。
f = open('dbo.chrRaces.Table.sql').read()
f = str(f).decode('utf-16le', errors='ignore').encode('utf8')
print f
解码这个文件的正确方法是什么,以便我可以用f.readlines() 解析它?
【问题讨论】:
-
如果这是在 Windows 上,请尝试以二进制模式打开文件,看看是否有帮助。
标签: python file encoding utf-8 utf-16