【发布时间】:2018-11-02 07:26:52
【问题描述】:
我有 3 个 excel 文件,每个文件有 4000 行和 5 列。我希望将 excel 文件合并到一个数据框中并删除重复的行。随后,我希望将结果发布为 excel 文件:
import pandas as pd
import numpy as np
filenames = ['Sample_a.xlsx','Sample_b.xlsx','Sample_c.xlsx']
dataframes = [pd.read_excel(f) for f in filenames]
new_dataframe = df.dropduplicates(dataframes)
我哪里错了?
【问题讨论】:
-
在这种情况下,变量
dataframes只是一个列表,它不是一个合并的数据框。我建议阅读 pandas docs 关于组合数据框。
标签: python pandas duplicates