【发布时间】:2019-08-17 17:54:49
【问题描述】:
我一直在尝试将数据另存为 excel 文件作为
CSV UTF-8(逗号分隔)(*.csv) 类型,这与普通文件不同
CSV(逗号分隔)(*.csv) 文件。它在excel中打开时显示unicode文本。我可以从excel轻松保存为该文件,但从python我只能将它保存为普通的csv。这不会导致数据丢失,但打开时会显示这种文本“à¤à¤‰à¤Ÿà¤¾”而不是“एउटा”这个文本。
如果我将使用记事本打开的文本复制到 excel 文件中,然后手动将文件另存为 CSV UTF-8,则它会保留正确的显示。但是这样做很耗时,因为所有值都出现在记事本的同一行中,我必须在 excel 文件中将其分开。 所以我只想知道如何使用 python 将数据保存为 CSV UTF-8 格式的 excel。
我已经尝试了以下代码,但结果是正常的 csv 文件。
import codecs
import unicodecsv as csv
input_text = codecs.open('input.txt', encoding='utf-8')
all_text = input_text.read()
text_list = all_text.split()
output_list = [['Words','Tags']]
for input_word in text_list:
word_tag_list = [input_word,'O']
output_list.append(word_tag_list)
with codecs.open("output.csv", "wb") as f:
writer = csv.writer(f)
writer.writerows(output_list)
【问题讨论】: