【发布时间】:2018-11-13 10:36:06
【问题描述】:
我们在 jupyter notebook 上使用 pandas 来加载一个 csv 文件,例如:
import pandas as pd
dat=pd.read_csv("data.csv")
多次运行上述代码行仅返回前 1024 列。我们尝试了以下选项:
pd.read_csv("data.csv", na_values ='na', engine='python', delimiter=',', header=0, quoting=csv.QUOTE) to no avail.
这是数据的快照:
将 csv 文件作为 pandas 数据框读取的正确方法是什么?
【问题讨论】:
-
如果没有您的实际 csv 就无法回答以重现
-
我认为 read_csv 不会限制您读取标头长度超过 1024 的 csv 文件。我为您检查了下面的代码,
df=pd.DataFrame(index=range(1),columns=range(1200)) df.to_csv('s14.csv') df=pd.read_csv('s14.csv') print df但按我的预期工作。 -
read_csv是将 csv 文件作为 pandas 数据帧读取的正确方法。你得到所有的列吗?还是只显示 1024 列?为您的问题提供更多详细信息 -
我过去发现 Excel 将文档限制为一定数量的列,也许这就是您的问题的原因?
-
@svk - 我认为您的文件仅解析为仅获得 1024 列,文件一定存在问题,一个典型的问题是分隔符意外中断。请仔细查看您的输入文件。