【发布时间】:2016-02-19 09:05:47
【问题描述】:
我需要将文件转换为 8 位(西里尔文/8859-5),所以我在做
iconv --from-code=UTF-8 --to-code=ISO-8859-5 file.UTF8 -o file.ISO
它有效,最后当我检查我得到的编码时
file -bi file.ISO
text/plain; charset=iso-8859-1
为什么选择 ISO-8859-1?
【问题讨论】:
我需要将文件转换为 8 位(西里尔文/8859-5),所以我在做
iconv --from-code=UTF-8 --to-code=ISO-8859-5 file.UTF8 -o file.ISO
它有效,最后当我检查我得到的编码时
file -bi file.ISO
text/plain; charset=iso-8859-1
为什么选择 ISO-8859-1?
【问题讨论】:
file 命令只对文件编码进行猜测。如果不在字典数据库中查找单词,可能很难确定 ISO 8859-5 和 ISO 8859-1,因为它们都是相似的 8 位格式。
只要您知道该文件确实是 ISO 8859-5,那才是最重要的。
注意:我刚刚了解到(令人困惑的)ISO 8859-9 显然被非正式地称为“Latin-5”,所以我删除了对那个令人困惑的引用名字。
【讨论】: