【发布时间】:2016-08-09 12:20:34
【问题描述】:
我目前正在从文件中读取邮件并处理一些标题信息。非 ASCII 字符根据 RFC2047 在带引号的可打印或 Base64 中进行编码,因此文件不包含非 ASCII 字符。如果文件以 UTF-8、Win-1252 或 ISO-8859-* 字符编码之一编码,我不会遇到问题,因为 ASCII 嵌入在所有这些字符集中的相同位置(所以 0x41 是A 在所有这些字符集中)。
但是,如果文件是使用不以这种方式嵌入 ASCII 的编码进行编码的呢?这样的编码是否存在?如果是这样,是否有可靠的方法来检测它们?
【问题讨论】:
标签: encoding character-encoding ascii