【问题标题】:Pandas to_csv leads to extra linesPandas to_csv 导致额外的行
【发布时间】:2018-10-28 16:20:05
【问题描述】:

数据框有906133行,如:

df.shape

(906133, 24)

我尝试将其保存为 csv 文件:

df.to_csv('df.csv',encoding='utf-8-sig',index=False)

然后再读一遍;

test_lines = pd.read_csv('df.csv')

但是,它现在有更多的行:

test_lines.shape

(16512050, 24)

经过一番观察,多余的行主要包含一系列点(............)或逗号(,,,,,,,,,,,,,,,,)。如果我将 sep = '\t' 用于保存和读取命令,额外的行数会减少,但仍然存在。

【问题讨论】:

  • 您能否发布一个示例,说明您的数据是什么样的。您似乎没有正确阅读 csv

标签: pandas dataframe


【解决方案1】:

我遇到了类似的问题,但是我是从头开始构建 csv(不是导入)。

使用这些参数后,我的空白行消失了:

df.to_csv('df.csv', mode='w', encoding='utf-8', index=False, line_terminator='\n')

我责怪 line_terminator 是罪魁祸首,但 index 参数也对一些额外的分隔符负责。我希望这对您也有帮助。 正如@Vishnudev 所写,我们没有您的数据集,因此我们无法测试。如果您提交,我们可以确认。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-05-31
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-10-14
    • 2014-04-20
    相关资源
    最近更新 更多