【发布时间】:2017-04-17 09:30:18
【问题描述】:
我有一个这样的熊猫数据框:
df = pd.DataFrame({'a1':['astr1','jmtr2','astr2','mmsk3',
'astr6','jmtr2','astr2','mhhk',
'astr5','mmsk','astr6','astr1',
'mstr1','mhhk','mstr2','mhhk'],
'a2':[x for x in np.random.randn(16)]})
df
a1 a2
0 astr1 -0.490416
1 jmtr2 0.651627
2 astr2 0.784004
3 mmsk3 -1.595870
4 astr6 1.228631
5 jmtr2 -1.644518
6 astr2 -0.311709
7 mhhk -1.284221
8 astr5 -0.356339
9 mmsk -0.071046
10 astr6 1.620838
11 astr1 -0.717384
12 mstr1 0.830618
13 mhhk -0.020226
14 mstr2 -0.056465
15 mhhk -0.160234
如果前四个字母相同,我现在要做的是合并a1。同时需要添加a2的值。
像这样:
a1 a2
0 astr $sum of astr$
1 jmtr $sum of jmtr$
2 mmsk $sum of mmsk$
3 mhhk $sum of mhhk$
4 mstr $sum of mstr$
【问题讨论】:
标签: python string pandas group-by sum