【发布时间】:2018-04-16 03:32:10
【问题描述】:
我有一个 df,
Name Count
Ram 1
ram 2
raM 1
Arjun 3
arjun 4
我想要的输出df,
Name Count
Ram 4
Arjun 7
我尝试了 groupby 但我无法达到所需的输出,请帮助
【问题讨论】:
标签: python pandas dataframe data-analysis
我有一个 df,
Name Count
Ram 1
ram 2
raM 1
Arjun 3
arjun 4
我想要的输出df,
Name Count
Ram 4
Arjun 7
我尝试了 groupby 但我无法达到所需的输出,请帮助
【问题讨论】:
标签: python pandas dataframe data-analysis
【讨论】:
RAM 1 在数据中你需要输出 Ram 4 吗?是否可以RAM a, Ram A, rAM a 值然后输出Ram a 4 ?
df1 = pd.DataFrame({'Name' : ['RAM a','ram a','ram a','raM a','Arjun','Arjun','Arjun','arjun','arjun','arjun','arjun']}) - ` a = df1['Name'].groupby(df1['Name'].str.title()).size().reset_index(name ='Count')` 或a = df1['Name'].groupby(df1['Name'].str.capitalize()).size().reset_index(name='Count')
In [71]: df.assign(Name=df['Name'].str.capitalize()).groupby('Name', as_index=False).sum()
Out[71]:
Name Count
0 Arjun 7
1 Ram 4
【讨论】:
如果我按title 格式化字符串分组,它会简化我必须采取的步骤。
df.Count.groupby(df.Name.str.title()).sum().reset_index()
【讨论】: