【发布时间】:2013-04-01 20:23:29
【问题描述】:
os.listdir() 读取了大约 1000 个文件名,其中一些以 UTF8 编码,一些是 CP1252。
我想将它们全部解码为 Unicode,以便在我的脚本中进行进一步处理。有没有办法让源编码正确解码成 Unicode?p>
例子:
for item in os.listdir(rootPath):
#Convert to Unicode
if isinstance(item, str):
item = item.decode('cp1252') # or item = item.decode('utf-8')
print item
【问题讨论】:
标签: python string unicode encoding byte