【发布时间】:2019-03-19 16:04:42
【问题描述】:
考虑以下DataFrame:
import numpy as np
import pandas as pd
arrays = [['foo', 'foo', 'foo', 'bar', 'bar', 'bar'],
['A', 'B', 'C', 'A', 'B', 'C']]
tuples = list(zip(*arrays))
index_values = pd.MultiIndex.from_tuples(tuples)
df = pd.DataFrame(np.random.rand(6), index = index_values)
print(df)
0
foo A 0.726699
B 0.001700
C 0.936495
bar A 0.298490
B 0.167234
C 0.476725
假设我想用以下值缩放 df:
df_scale = pd.DataFrame([0,1,4], index=['A','B','C'])
print(df_scale)
0
A 0
B 1
C 4
也就是说,我希望所有 A 乘以 0,所有 B 乘以 1,所有 C 乘以 4。
目前,我使用以下方法:
df_new = df.copy()
list_df_new_index = list(df_new.index)
for index in list_df_new_index:
cntr, prod = index
df_new.loc[cntr, prod] = df_new.loc[cntr, prod]*df_scale.loc[prod]
print(df_new)
0
foo A 0.000000
B 0.001700
C 3.745981
bar A 0.000000
B 0.167234
C 1.906900
虽然这可行,但我不禁想到 pandas 中有一个功能可以让我做到这一点。
我浏览了Select rows in pandas MultiIndex DataFrame 上的答案。
起初我以为我可以使用 df.xs(),但如果我理解正确,这只允许我选择而不是更改值。
接下来我查看了 pd.IndexSlice(),但我不知道如何使用它来更改多个值。
pandas 是否提供在较低级别的 MultiIndex DataFrame 中更改多个值的功能?
【问题讨论】:
标签: python pandas dataframe indexing