【发布时间】:2019-01-15 14:33:36
【问题描述】:
我有两个 df - df_a 和 df_b,
# df_a
number cur code
1000 USD 700
2000 USD 800
3000 USD 900
# df_b
number amount deletion code
1000 0.0 L 700
1000 10.0 X 700
1000 10.0 X 700
2000 20.0 X 800
2000 20.0 X 800
3000 0.0 L 900
3000 0.0 L 900
我想将df_a 与df_b 合并,
df_a = df_a.merge(df_b.loc[df_b.deletion != 'L'], how='left', on=['number', 'code'])
另外,在合并结果df_a 中创建一个名为deleted 的标志,它具有三个可能的值——完整、部分和无;
full - 如果所有行都与特定的number 值关联,则有deletion = L;
partial - 如果某些行与特定的number 值相关联,则具有deletion = L;
none - 没有与特定 number 值关联的行,有 deletion = L;
在进行合并时,不应考虑来自df_b 和deletion = L 的行;所以结果看起来像,
number amount deletion deleted cur code
1000 10.0 X partial USD 700
1000 10.0 X partial USD 700
2000 20.0 X none USD 800
2000 20.0 X none USD 800
3000 0.0 NaN full USD 900
我试过了,
g = df_b['deletion'].ne('L').groupby([df_b['number'], df_b['code']])
m1 = g.any()
m2 = g.all()
d1 = dict.fromkeys(m1.index[m1 & ~m2], 'partial')
d2 = dict.fromkeys(m2.index[m2], 'full')
d = {**d1, **d2}
df_a = df_a.merge(df_b.loc[df_b.deletion != 'L'], how='left', on=['code', 'number'])
df_a['deleted'] = df_a[['number', 'code']].map(d).fillna('none')
但我遇到了一个错误,
AttributeError: 'DataFrame' object has no attribute 'map'
似乎df 没有map 功能,所以我想知道是否有任何替代方法可以实现这一点。
【问题讨论】:
-
@jpp sry,再次更新,我试图
df_a['deleted'] = df_a[['number', 'code']].map(d).fillna('none'),导致错误,所以想知道是否有其他方法可以做同样的事情。
标签: python python-3.x pandas dictionary dataframe