【发布时间】:2015-08-25 08:41:30
【问题描述】:
我正在尝试确定是否使用
PrintWriter pw = new PrintWriter(outputFilename, "ISO-8859-1");
或
PrintWriter pw = new PrintWriter(outputFilename, "US-ASCII");
我正在阅读 All about character sets 以确定示例文件的字符集,我必须通过 java 代码以相同的编码创建该文件。
当我的示例文件包含“欧洲”字母(挪威语:å ø æ)时,以下命令告诉我文件编码为“iso-8859-1”
file -bi example.txt
但是,当我复制同一个示例文件并对其进行修改以包含不同的数据时,没有任何挪威语文本(假设我将“Bjørn”替换为“Bjorn”),然后相同的命令告诉我文件编码是“us-ascii”。
file -bi example-no-european-letters.txt
这是什么意思?如果其中没有“欧洲”字符,那么 ISO-8859-1 在实践中是否与 US-ASCII 相同?
我应该只使用字符集“ISO-8559-1”,一切都会好起来的吗?
【问题讨论】:
-
您是否尝试在名为
inputStream的变量上使用PrintWriter?这听起来倒退了。 -
你是对的——我的错。编辑修复。
标签: java character-encoding ascii iso-8859-1 character-set