【问题标题】:Merge multiple data frames by date (remove duplicates)按日期合并多个数据框(删除重复项)
【发布时间】:2021-03-08 11:03:44
【问题描述】:

我正在尝试从多个数据帧中获取组合数据帧。基本上每个数据框都是一个月的数据。所以每个都有一个日期和一些带有其他值的列。但是,每个数据框的长度并不总是相同的,其中一些日期会重复。

所以我想做的是合并我所有的数据框(从每个月的 12 个不同的数据框生成一年的数据),所以我最终得到一个没有重复日期的数据框。需要指出的是,每个数据框中的列都是相同的。只是价值观不同。

这可以通过简单的方式完成,还是...?

【问题讨论】:

    标签: python pandas dataframe merge


    【解决方案1】:

    导入模块。

    import pandas as pd
    

    数据示例。

    df1 = pd.DataFrame({'Date':['2020-6-19', '2020-6-20', '2020-7-20'], 'A':[1,2,3]})
    df2 = pd.DataFrame({'Date':['2020-7-20', '2020-7-22'], 'A':[1,2]})
    df1['Date'] = pd.to_datetime(df1['Date'])
    df2['Date'] = pd.to_datetime(df2['Date'])
    

    连接您的不同 DataFrame 并将重复项放在 Date 上。

    pd.concat([df1,df2]).drop_duplicates('Date').reset_index(drop=True)
    

    【讨论】:

    • 太好了,很高兴它有帮助。
    猜你喜欢
    • 2020-11-05
    • 1970-01-01
    • 2011-11-18
    • 1970-01-01
    • 2021-02-05
    • 2019-08-18
    • 2020-05-12
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多