【发布时间】:2013-03-09 05:54:48
【问题描述】:
我正在尝试从以 Unicode 编码的 .txt 文件中提取数据,因为其中有重音符号(法语名称)。下面是我的一部分代码。字符串 postalCode 的输出中有奇怪的小方块 (squareHsquare1square)。我怀疑这个问题与将内容视为 ASCII 的程序有关。有人请指出我正确的方向。谢谢!
Scanner in = new Scanner(new FileReader("postal_codes.txt"));
currentLine = in.nextLine();
//take first 6 char --> store as variable
postalCode = currentLine.substring(0, 5);
【问题讨论】:
-
“Unicode 编码”是什么意思? Unicode 不是一种编码。
-
@R.MartinhoFernandes 抱歉,如果该陈述不正确;我不是天才。我想你可以猜到我的意思。
-
关键是我做不到。我可以做出几个有根据的猜测,但无法确定是哪一个。
标签: java unicode non-ascii-characters