【发布时间】:2020-09-01 04:50:41
【问题描述】:
我需要从一组文件中识别没有 BOM/ANSI 格式的 UTF8 文件。如何识别这些文件格式?当前使用的策略是检查文件格式是否属于任何已知格式(有 BOM),如果不声明为 UTF8/ANSI。有没有直接找到这些格式的方法?
【问题讨论】:
-
这能回答你的问题吗? Howto identify UTF-8 encoded strings
-
UTF8 不是 ANSI(而且 ANSI 也不是真正的 ANSI,它只是一个错误的名称)。
标签: utf-8 ansi byte-order-mark