【发布时间】:2018-10-28 16:20:05
【问题描述】:
数据框有906133行,如:
df.shape
(906133, 24)
我尝试将其保存为 csv 文件:
df.to_csv('df.csv',encoding='utf-8-sig',index=False)
然后再读一遍;
test_lines = pd.read_csv('df.csv')
但是,它现在有更多的行:
test_lines.shape
(16512050, 24)
经过一番观察,多余的行主要包含一系列点(............)或逗号(,,,,,,,,,,,,,,,,)。如果我将 sep = '\t' 用于保存和读取命令,额外的行数会减少,但仍然存在。
【问题讨论】:
-
您能否发布一个示例,说明您的数据是什么样的。您似乎没有正确阅读 csv