【问题标题】:Merge multiple data frames by date (remove duplicates)按日期合并多个数据框(删除重复项)
【发布时间】:2021-03-08 11:03:44
【问题描述】:
我正在尝试从多个数据帧中获取组合数据帧。基本上每个数据框都是一个月的数据。所以每个都有一个日期和一些带有其他值的列。但是,每个数据框的长度并不总是相同的,其中一些日期会重复。
所以我想做的是合并我所有的数据框(从每个月的 12 个不同的数据框生成一年的数据),所以我最终得到一个没有重复日期的数据框。需要指出的是,每个数据框中的列都是相同的。只是价值观不同。
这可以通过简单的方式完成,还是...?
【问题讨论】:
标签:
python
pandas
dataframe
merge
【解决方案1】:
导入模块。
import pandas as pd
数据示例。
df1 = pd.DataFrame({'Date':['2020-6-19', '2020-6-20', '2020-7-20'], 'A':[1,2,3]})
df2 = pd.DataFrame({'Date':['2020-7-20', '2020-7-22'], 'A':[1,2]})
df1['Date'] = pd.to_datetime(df1['Date'])
df2['Date'] = pd.to_datetime(df2['Date'])
连接您的不同 DataFrame 并将重复项放在 Date 上。
pd.concat([df1,df2]).drop_duplicates('Date').reset_index(drop=True)