【发布时间】:2014-08-26 05:49:25
【问题描述】:
来自 Excel,非常愿意改用 Pandas 我正在阅读 Wes McKinneys 的书……从中获得了很多乐趣……但也尝试了一些我自己的东西……
假设我们有一个可以通过以下 csv 文件读取的数据框:
city,inhabitants,city_type,county
city a,9483,city,diggersville
city b,2628,city,diggersville
city c,5206,city,diggersville
city d,5206,city,diggersville
city e,839,village,crazytown
city f,3574,city,crazytown
city g,35,village,crazytown
city h,8214,city,downsend
city i,4278,city,downsend
所以我的代码是这样的:
data = pd.read_csv('test.txt')
我想根据县和城市类型组合计算以下两件事:
- 居民总数
- 城市/村庄的计数
并且我希望将这些彼此作为我生成的数据框中的列。
我知道如何计算两个单独的事实:
data.groupby(['city_type','county']).sum()
data.groupby(['city_type','county']).city.count()
但如上所述,我希望将这些组合到一个结果数据框中(如 Excel 中的数据透视表):
my_count my_sum
city_type county
city crazytown 1 3574
diggersville 4 22523
downsend 2 12492
village crazytown 2 874
感谢任何关于如何完成的帮助,因为我真的想向我的同事展示 Python 非常简单:)
【问题讨论】: