【发布时间】:2019-10-22 10:55:33
【问题描述】:
我有 10 个很大的 csv 文件。我愿意
1) 读取这些文件
2) 创建数据框(以文件名作为数据框名称)
3) 根据给定的连接键,左外连接所有这些。 POIU and
BVCX have only one common column to merge which is A 。请注意文件 'ABCDE' 是基础 df。所有其他数据框都应与此 'ABCDE' df 保持外部连接。也有可能还有其他常用键。但我想根据键 A 和 B 加入,无论这两者中的哪一个都存在
我能够完成如下所示的前两个步骤
filenames = sorted(glob.glob('*.csv'))
df_list=[]
for f in filenames:
print(f)
t = vars()['df'+ f = pd1.read_csv(f,low_memory=False)
df_list.append(t)
但我被困在如何离开外连接这一切并创建一个最终的数据框,该数据框将被命名为df_final?
【问题讨论】:
-
什么是左外合并?我知道左合并和外合并。
-
没有左外连接之类的吗?
-
文件 'ABCDE' 是基本数据框。所有其他数据框都应该加入到这个
标签: python python-3.x pandas dataframe merge