【发布时间】:2018-10-09 05:10:10
【问题描述】:
更新:pandas 0.23.0 版解决了这个问题
Sorting by a combination of columns and index levels
我一直在努力解决这个问题,我怀疑有更好的方法。如何按索引级别名称“idx_0”、级别=0 和列“value_1”降序对以下数据帧进行排序,以使“MyName”列读取垂直“SCOTTBOSTON”。
import pandas as pd
import numpy as np
df = pd.DataFrame({'idx_0':[2]*6+[1]*5,
'idx_1':[6,4,2,10,18,5,11,1,7,9,3],
'value_1':np.arange(11,0,-1),
'MyName':list('BOSTONSCOTT')})
df = df.set_index(['idx_0','idx_1'])
df
输出:
MyName value_1
idx_0 idx_1
2 6 B 11
4 O 10
2 S 9
10 T 8
18 O 7
5 N 6
1 11 S 5
1 C 4
7 O 3
9 T 2
3 T 1
使用例外的输出:
df.sort_values(['value_1'], ascending=False)\
.reindex(sorted(df.index.get_level_values(0).unique()), level=0)
我怀疑有一种更简单的方法,无需重置索引
MyName value_1
idx_0 idx_1
1 11 S 5
1 C 4
7 O 3
9 T 2
3 T 1
2 6 B 11
4 O 10
2 S 9
10 T 8
18 O 7
5 N 6
失败#1:
df.sort_values('value_1', ascending=False).sort_index(level=0)
首先按值排序,然后排序索引 level=0,但 level=1 也会排序。
MyName value_1
idx_0 idx_1
1 1 C 4
3 T 1
7 O 3
9 T 2
11 S 5
2 2 S 9
4 O 10
5 N 6
6 B 11
10 T 8
18 O 7
失败 #2
df.sort_index(level=0).sort_values('value_1', ascending=False)
按索引级别 = 0 排序,然后按值排序,但索引 = 0 再次变得混乱。
MyName value_1
idx_0 idx_1
2 6 B 11
4 O 10
2 S 9
10 T 8
18 O 7
5 N 6
1 11 S 5
1 C 4
7 O 3
9 T 2
3 T 1
【问题讨论】:
-
我找不到任何优雅的解决方案。这是一种选择:
df.reset_index(level=0).sort_values(['idx_0','value_1'], ascending=[1,0]).set_index('idx_0', append=True).swaplevel(),但您的版本看起来更好......
标签: python pandas dataframe multi-index