【发布时间】:2017-06-08 07:20:34
【问题描述】:
我正在处理一个 Python 文件,该文件输入一个包含日文字符 (UTF-8) 的文本文件,获取一些文本,然后将其写入一个新的 UTF-8 文本文件。
我遇到的问题是,由于某种原因,每当日文字符 だ 出现在原始输入文件的行尾时,它就会在输出文件中显示为菱形问号。
在行尾之前的 だ 实例读取非常好,原始输入文件即使在行尾也读取非常好。
【问题讨论】:
-
使用 python 2.7 还是 3.x? python 3.x 有更好的 unicode 支持
-
这里的解释是针对 Java 的,但在这里也很重要stackoverflow.com/a/24009294/1530987
-
请分享代码sn-p。