【发布时间】:2018-12-10 17:27:31
【问题描述】:
我有两个 DF1 和 DF2,如下所述。两个数据框的第一列“POS”可能有匹配项,但其他列会有所不同。我想比较两个数据帧的“POS”列,如果 DF1 的“POS”值在 DF2“POS”列中,我想将该行存储在新的 DF1 数据帧中并对 DF2 执行相同的操作。通过将 POS 作为键并比较它们以获得相应的值,我可以很容易地使用字典。但是字典不会接受重复的 'POS' 值,所以我想知道 Pandas DF 中是否有解决方案。
df1 =
POS id freq
0 100 "idex" 3.0
1 102 "ter" 2.0
2 102 "pec" 4.0
3 103 "jek" 4.0
4 104 "jek" 4.0
df2 =
POS id freq
0 100 "treg" 3.0
1 102 "dfet" 2.2
2 102 "idet" 7.0
3 108 "jeik" 1.0
4 109 "jek" 4.0
Expected:
new_df1 =
POS id freq
0 100 "idex" 3.0
1 102 "ter" 2.0
2 102 "pec" 4.0
new_df2 =
POS id freq
0 100 "treg" 3.0
1 102 "dfet" 2.2
2 102 "idet" 7.0
【问题讨论】:
-
您能否更好地使这些框架复制可粘贴?要么是完整列表,要么是粘贴
df.head()的输出,而不是两者兼而有之。 -
很抱歉。非常感谢您修复它们@sacul
-
听起来您想在一个条件下加入(df1.POS==df2.POS)并保留第一个数据帧,然后对第二个数据帧执行相同的操作。是这样的程度吗?