【发布时间】:2021-11-08 05:22:11
【问题描述】:
我有一个需要分析的 1 亿行数据集。我使用这个函数来读取文件:
csv2020=pd.read_csv('filename.txt',
sep="\t",
error_bad_lines=False,
usecols=['field1', 'field2', 'field3', 'field4'],
dtype={'field1': int,'field2': float, 'field3': float, 'field4': float})
但是我收到了一个错误,其中一条线无法转换为浮点数:
ValueError:无法将字符串转换为浮点数:'ORCH'
我想省略任何发生此错误的行,但除了 error-bad-lines 参数之外我不知道如何。帮忙?
谢谢!
【问题讨论】:
-
as
filename.txt包含 1 亿行 - 你认为你有足够的内存来加载它吗?
标签: python pandas csv large-data