【发布时间】:2012-11-23 02:02:12
【问题描述】:
一个 csv(逗号分隔)文件,其中行有一个额外的尾随分隔符,似乎混淆了pandas.read_csv。 (数据文件为[1])
它将额外的分隔符视为额外的列。所以比标题要求的多一列。然后pandas.read_csv 将第一列作为行标签。总体效果是列和标题不再对齐 - 第一列成为行标签,第二列由第一个标题命名,等等。
这很烦人。知道如何告诉pandas.read_csv 做正确的事吗?我找不到。
好书,顺便说一句。
[1]: 2012 FEC Election Database 来自 Python for Data Analysis 一书的第 9 章
【问题讨论】:
标签: python pandas numpy csv delimiter