【发布时间】:2017-03-09 06:12:04
【问题描述】:
我有一个包含 1461 个属性的 csv 文件。我想将它加载到熊猫数据框中。问题是,许多行没有尾随连续列的值。因此 pandas 由于长度不规则而导致解析错误。如何一次性输入前导列的缺失值并将csv文件加载到数据框中?
编辑1 我们可以看到数据集csv文件如下
a,b,c,d,e,f,g,h,i"""
1,2,4,5
1,0,9,8,7,6,5,4,7
1,3,5,6,7
6,7,8,8,9,4,5,3,5"""
我想要一个如下所示的熊猫数据框
"""a b c d e f g h i
1 2 4 5 ? ? ? ? ?
1 0 9 8 7 6 5 4 7
1 3 5 6 7 ? ? ? ?
6 7 8 8 9 4 5 3 5"""
NaN 代替 ?可以的
我们没有足够的逗号不等长问题。
【问题讨论】:
-
你能告诉我们错误跟踪吗?
-
听起来你需要在 pandas 之外对文件进行预处理。
-
你能给一些文件样本 - 10行不规则长度吗?是否也缺少分隔符?