试图在python中读取一个非常大的文本列表[重复]答案

【问题标题】：Trying to read an extremely large text list in python [duplicate]试图在python中读取一个非常大的文本列表[重复]
【发布时间】：2017-04-12 11:30:23
【问题描述】：

我目前正在尝试通过删除不相关的数据来缩小大型列表的大小。我目前正在使用

with open("list.txt") as f_line:
    for line in f_line:
       Doing_things()

它目前正在使用较小比例的文件，但是当使用较大的主文件时，它会出现以下错误。

UnicodeDecodeError：“ascii”编解码器无法解码位置 3656 中的字节 0xe2：序数不在范围内（128）

是否有另一种方法可以将列表读入 python。该文件还具有超过 10000 个列表的单个数据点。感谢您的帮助。

【问题讨论】：

标签： python list

【解决方案1】：

原因可能是对文件编码的“误解”。您的 python 解释器需要一个编码为 ascii 的文本文件，但实际上它被编码为 unicode 或 latin1。如果它包含重音字符，它肯定不是 ascii 文件。

您使用哪个版本的python？ Python 2 处理文本的方式与 Python 3 不同。

如果不清楚，我通常使用 notepad++ 来检查文本文件中使用了哪种编码。

一旦您知道使用了哪种编码，您就可以像 here 这样指定它with open('list.txt', encoding='utf-8') as f_line:

【讨论】：