【发布时间】:2017-03-03 00:27:59
【问题描述】:
我是 Pandas 的新手,正在尝试删除一些不必要的列,然后删除重复的记录。脚本的第一部分在删除列时起作用。但是,脚本没有执行任务的第二部分,因为还有很多重复项。任何帮助将不胜感激。
import pandas as pd
f =pd.read_csv("filename.csv")
keep_col =['ZIP5','STATE CODE','STATE','COUNTY CODE','COUNTY NAME','CBSA CODE','CBSA TITLE','CBSA LSAD','METRO DIVISION CODE','METRO DIVISION TITLE','METRO DIVISION LSAD','CSA CODE','CSA TITLE','CSA LSAD']
new_f = f[keep_col]
new_f.drop_duplicates()
new_f.to_csv("newfile.csv", index=False)
【问题讨论】:
标签: python pandas duplicates