【发布时间】:2016-06-15 20:37:06
【问题描述】:
经过研究,我在这个论坛或任何其他论坛上都没有发现类似的问题。
我正在按内部级别对 MultiIndex 数据帧进行分组。问题是,在分组之后,我仍然想知道这个内部索引上哪些是“选择的值”。
所以我有类似的东西
df = pd.DataFrame([['A', 1, 3],
['A', 2, 4],
['A', 3, 6],
['B', 1, 9],
['B', 2, 10],
['B', 4, 6]],
columns=pd.Index(['Name', 'Date', 'Value'], name='ColumnName')
).set_index(['Name', 'Date'])
ColumnName Value
Name Date
A 1 3
2 4
3 6
B 1 9
2 10
4 6
我想要的是
ColumnName Value
Name Date
A 3 6
B 4 6
我能做的就是使用这个命令:
df.groupby(level=('Name')).last()
正在检索这个:
ColumnName Value
Name
A 6
B 6
或者,使用以下命令:
df.groupby(level=('Name','Date')).last()
检索错误。
请记住,这是一个性能敏感的应用程序。
想法?
编辑:同时我确实提交了feature request at GitHub
【问题讨论】:
标签: python performance pandas