index.levels
您可以直接访问MultiIndex 的每个级别的独特元素:
df = pd.DataFrame([['A', 'W', 1], ['B', 'X', 2], ['C', 'Y', 3],
['D', 'X', 4], ['E', 'Y', 5]])
df = df.set_index([0, 1])
a = df.index.levels[1]
print(a)
Index(['W', 'X', 'Y'], dtype='object', name=1)
要了解可用信息,请查看Index 对象在内部的存储方式:
print(df.index)
MultiIndex(levels=[['A', 'B', 'C', 'D', 'E'], ['W', 'X', 'Y']],
labels=[[0, 1, 2, 3, 4], [0, 1, 2, 1, 2]],
names=[0, 1])
但是,以下方法更直观且文档更完善。
值得注意的一点是,您不必通过 values 属性显式提取 NumPy 数组。您可以直接迭代 Index 对象。此外,Pandas 支持并鼓励方法链接。
drop_duplicates / 唯一
返回一个Index 对象,并保留顺序。
a = df.index.get_level_values(1).drop_duplicates()
# equivalently, df.index.get_level_values(1).unique()
print(a)
Index(['W', 'X', 'Y'], dtype='object', name=1)
设置
返回set。对 O(1) 查找有用,但结果是无序的。
a = set(df.index.get_level_values(1))
print(a)
{'X', 'Y', 'W'}