【发布时间】:2020-09-07 14:10:05
【问题描述】:
我正在使用通常的 pd.read_csv 将 csv 文件读入 pandas。这一切正常。但是,我的大多数 csv 文件末尾都有一行,其中“#EOD”作为第一列值,表示该表的最后一行。在此之后可能会有更多行包含所有“nan”值。
pd.read_csv('test.csv')
Out[1]:
A B C D
0 C1 A 0.5 9
1 C2 A 0.2 1
2 C3 A 0.3 7
3 C4 B 0.2 4
4 #EOD None nan nan
5 * None nan nan
在读取 csv 文件时,如何删除“#EOD”行之后的所有行,包括“#EOD”行?我不知道它在“#EOD”之后是只有一行还是几行,它可能因文件而异。
【问题讨论】:
-
您在 csv 文件中是否还有其他
nan值。我认为简单的df.dropna(inplace=True)应该可以工作,因为在包含#EOD的行中有/将会有nan值。 -
是的,可以有很多 nan 值,所以不幸的是,这不起作用