【发布时间】:2020-08-07 17:10:14
【问题描述】:
我有在 pandas 中读取的 CSV 文件:
#!/usr/bin/env python
import pandas as pd
import sys
filename = sys.argv[1]
df = pd.read_csv(filename)
很遗憾,这些文件的最后一行经常损坏(逗号数量错误)。目前我在文本编辑器中打开每个文件并删除最后一行。
是否可以删除加载 CSV 的同一 python/pandas 脚本中的最后一行,以节省必须采取这个额外的非自动化步骤?
【问题讨论】:
-
你删除了一个关于提取数字的问题,无论如何我建议使用
str.extract:for col in df.columns[2:]: df[col] = df[col].str.extract(r'(\d+)').astype(int) -
@EdChum 您的代码是否保留小数点?
-
@EdChum 我取消了上一个问题。