【发布时间】:2021-08-04 17:02:42
【问题描述】:
我尝试使用以下代码加载包含 43186 行的 CSV 文件:
import csv
import pandas as pd
df = pd.read_csv('file.csv', sep=',', engine='python', error_bad_lines=False)
输出
Skipping line 2574: field larger than field limit (131072)
Skipping line 892: Expected 13 fields in line 892, saw 15
Skipping line 6376: Expected 13 fields in line 6376, saw 15
Skipping line 35433: Expected 13 fields in line 35433, saw 15
在内核最终死掉之前。我尝试了其他一些更大的 CSV,同样的代码适用于其他人。我怎样才能解决这个问题?我可以跳过行。我尝试使用csv.field_size_limit(sys.maxsize) 增加限制
但它也不起作用。我从第 35433 行浏览到最后,那里没有坏行,如果确实存在坏行,应该被 error_bad_lines=False 跳过,对吧?任何帮助将不胜感激!
【问题讨论】:
标签: python pandas dataframe csv