【发布时间】:2015-12-23 03:07:38
【问题描述】:
我想从一个文件夹中读取所有文件(使用os.walk)并将它们转换为一种编码(UTF-8)。问题是这些文件没有相同的编码。它们可以是 UTF-8、带有 BOM 的 UTF-8、UTF-16。
有没有什么方法可以在不知道编码的情况下读取这些文件?
【问题讨论】:
-
在最一般的意义上,没有。但是您可以使用各种启发式方法来尝试一下,这非常依赖于您的特定数据集。
标签: python python-3.x encoding readfile