【发布时间】:2016-05-09 03:51:21
【问题描述】:
我有这个 Python 脚本,它获取网页的信息,然后将此信息保存到文本文件中。但是这个文本文件的名字会不时改变,有时会变成西里尔字母,有时会变成韩文。
问题是,如果我尝试使用名称“бореиская”保存文件,那么当我在 Windows 中查看它时,该名称会显得很奇怪。
我猜我需要在某些地方更改一些编码。但是名称正在发送到open() 函数:
server = "бореиская"
file = open("eu_" + server + ".lua", "w")
我之前是从一个已经包含所有名称的数组中获取服务器变量。
但如前所述,在 Windows 中,名称出现时带有一些非常奇怪的字符。
【问题讨论】:
-
你用的是哪个版本的python? Unicode 字符串在 python2 中应以
u"бореиская"为前缀,而在 3 中 unicode 是默认值。同样,在从流中读取时,您可以将其编码/解码到/从 utf-8。 Relevant docs -
使用 python 2.7,将尝试应用您链接的文档中提到的更改。之前没发现。将返回结果。
标签: python python-2.7 unicode encoding cyrillic