【发布时间】:2020-02-19 00:07:24
【问题描述】:
我有一个 csv 的问题,它在一列中有一个拆分到一个新的行。我可以手动编辑 .csv 来解决这个问题,但有大约 200 个文件。
数据集包含更多列并且可以包含空值,但是最后一列始终有一个值。该问题也每次仅发生在同一列中。所以我想找出最后一个值为 null 的时间,然后尝试用 .shift() 填充这些值,但希望有一种更简单的方法。
在 vscode 中查看
orderid,fruit,count,person
3523,apple,84,peter
2522,green
grape, 99, mary
1299, watermelon, 93, paul
pandas read_csv
orderid fruit count person
3523 apple 84 peter
2522 green NaN NaN
grape 99 mary NaN
1299 watermelon 93 paul
想要的列
orderid fruit count person
3523 apple 84 peter
2522 green grape 99 mary
1299 watermelon 93 paul
【问题讨论】:
-
*edit、vscode 和 notepad++ 显示相似的结果。
-
你是怎么得到这个 CSV 的?如果您使用 python
open()、write()创建它,那么您应该使用模块csv,它应该将green grape与" "一起写入文件中创建正确的 csv 数据。然后 pandas 会正确读取它。 -
可悲的是他们下载的那样......我没有创建它们。
-
我添加了一个部分,以便从所有 csv 文件轻松创建 DataFrame。
标签: python pandas csv text-processing