【发布时间】:2017-09-06 00:31:39
【问题描述】:
我正在使用 python csvkit 来比较 2 个这样的文件:
df1 = pd.read_csv('input1.csv', sep=',\s+', delimiter=',', encoding="utf-8")
df2 = pd.read_csv('input2.csv', sep=',\s,', delimiter=',', encoding="utf-8")
df3 = pd.merge(df1,df2, on='employee_id', how='right')
df3.to_csv('output.csv', encoding='utf-8', index=False)
目前我正在通过一个脚本运行该文件,该脚本会从employee_id 列中删除空格。
employee_ids 的一个例子:
37 78973 3
23787
2 22 3
123
有没有办法让csvkit 做到这一点并为我节省一步?
【问题讨论】:
-
df1.employee_id = df1.employee_id.str.strip() -
skipinitialspace=True中的read_csv怎么样?