【发布时间】:2024-01-17 17:11:02
【问题描述】:
我的数据集如下所示:
ID | country
1 | USA
2 | USA
3 | Zimbabwe
4 | Germany
我执行以下操作来获取第一个国家/地区的名称及其对应的值。所以在我的情况下是:
df.groupby(['country']).country.value_counts().nlargest(5).index[0]
df.groupby(['country']).country.value_counts().nlargest(5)[0]
df.groupby(['country']).country.value_counts().nlargest(5).index[1]
df.groupby(['country']).country.value_counts().nlargest(5)[1]
etc.
输出将是:
(USA), 388
(DEU), 245
etc.
然后我重复它,直到我获得数据集中的前 5 个国家/地区。
但是,我怎样才能获得一个“其他”或“其他”列,将所有其他国家/地区归为一类。所以像下面这样的国家在我的数据集中并不常见:
津巴布韦、伊拉克、马来西亚、肯尼亚、澳大利亚等
所以我想要一个输出如下所示的第六个值:
(其他),3728
如何在 pandas 中实现这一点?
【问题讨论】:
标签: python python-3.x pandas count series