【发布时间】:2019-04-16 15:11:46
【问题描述】:
有没有办法重新索引两个(不同级别的)数据帧,以便它们在所有级别共享一个公共索引?
演示:
创建一个名为“A”的基本数据框:
index = np.array(['AUD','BRL','CAD','EUR','INR'])
data = np.random.randint(1, 20, (5,5))
A = pd.DataFrame(data=data, index=index, columns=index)
创建一个名为“B”的多索引数据框:
np.random.seed(42)
midx1 = pd.MultiIndex.from_product([['Bank_1', 'Bank_2'],
['AUD','CAD','EUR']], names=['Bank', 'Curency'])
B = pd.DataFrame(np.random.randint(10,25,6), midx1)
B.columns = ['Notional']
基本 DF:
>>> Dataframe A:
AUD BRL CAD EUR INR
AUD 7 19 11 11 4
BRL 8 3 2 12 6
CAD 2 1 12 12 17
EUR 10 16 15 15 19
INR 12 3 5 19 7
多索引 DF:
>>> Dataframe B:
Notional
Bank Curency
Bank_1 AUD 16
CAD 13
EUR 22
Bank_2 AUD 24
CAD 20
EUR 17
目标是:
1) 重新索引 B,使其货币级别包括 A 索引中的每种货币。 B 然后看起来像这样(请参阅包括 BRL 和 INR,它们的名义值并不重要):
Notional
Bank Curency
Bank_1 AUD 16
CAD 13
EUR 22
BRL 0
INR 0
Bank_2 AUD 24
CAD 20
EUR 17
BRL 0
INR 0
2) 重新索引 A 以便它包含 B 索引的第一级中的每个银行。 A 将如下所示:
AUD BRL CAD EUR INR
Bank_1 AUD 7 19 11 11 4
BRL 8 3 2 12 6
CAD 2 1 12 12 17
EUR 10 16 15 15 19
INR 12 3 5 19 7
Bank_2 AUD 7 19 11 11 4
BRL 8 3 2 12 6
CAD 2 1 12 12 17
EUR 10 16 15 15 19
INR 12 3 5 19 7
这个应用程序将在更大的数据帧上,所以我需要一个 Python 的方法来做到这一点。
对于上下文,最终我想将 A 和 B 相乘。我正在尝试重新索引以获得匹配的索引,因为这被显示为一种将各种索引级别的数据帧相乘的干净方法: Pandas multiply dataframes with multiindex and overlapping index levels
感谢您的帮助。
【问题讨论】:
标签: pandas dataframe multi-index