【发布时间】:2013-07-04 02:33:13
【问题描述】:
我有一个 DataFrame,其索引名为 city_id 的城市,格式为 [city],[state](例如,new york,ny 在列中包含整数计数。问题是我对同一个城市有多个行,而我想要通过添加列值来折叠共享city_id 的行。我查看了groupby(),但如何将其应用于此问题并不是很明显。
编辑:
一个例子:我想改变这个:
city_id val1 val2 val3
houston,tx 1 2 0
houston,tx 0 0 1
houston,tx 2 1 1
进入这个:
city_id val1 val2 val3
houston,tx 3 3 2
如果有 ~10-20k 行。
【问题讨论】:
-
这不是真正的重复,@DSM 的答案
df.groupby(df.index)不会出现在重复的问题中。