【发布时间】:2018-11-15 07:07:25
【问题描述】:
我有这样的主数据集
master = pd.DataFrame({'Channel':['1','1','1','1','1'],'Country':['India','Singapore','Japan','United Kingdom','Austria'],'Product':['X','6','7','X','X']})
和这样的用户表
user = pd.DataFrame({'User':['101','101','102','102','102','103','103','103','103','103'],'Country':['India','Brazil','India','Brazil','Japan','All','Austria','Japan','Singapore','United Kingdom'],'count':['2','1','3','2','1','1','1','1','1','1']})
我希望主表与每个用户的用户表左连接。像下面的一个用户
merge_101 = pd.merge(master,user[(user.User=='101')],how='left',on=['Country'])
merge_102 = pd.merge(master,user[(user.User=='102')],how='left',on=['Country'])
merge_103 = pd.merge(master,user[(user.User=='103')],how='left',on=['Country'])
merge_all = pd.concat([merge_101, merge_102,merge_103], ignore_index=True)
如何在这里迭代每个用户我首先过滤数据集并创建另一个数据集并稍后附加整个数据集。
有没有更好的方法来完成这个任务,比如 for 循环或任何连接?
谢谢
【问题讨论】:
-
您可以复制和粘贴数据框而不是图像吗?其他人可以简单地复制和使用数据框来理解问题。另外,你能展示一下你当前和预期的输出吗?我认为不需要循环。
-
肯定会在一段时间内添加数据帧
-
@HarvIpan 添加了数据框
-
你能显示你的预期输出吗?您的代码有
Userid列,但您的数据框没有Userid列。 -
@HarvIpan 添加了更多信息