【发布时间】:2020-08-13 14:41:33
【问题描述】:
假设我要创建一个多索引和多列数据框:
X Y
Planet Continent Country A B C D
Earth Europe England 0.3 0.5 0.6 0.8
Europe Italy 0.1 0.2 0.4 1.2
Mars Tempe Sirtys 3.2 4.5 2.3 4.2
我想通过迭代收集数据帧的每一行来做到这一点,
row1 = np.array(['Earth', 'Europe', 'England', 0.3, 0.5, 0.6, 0.8])
row2 = np.array(['Earth', 'Europe', 'Italy', 0.1, 0.2, 0.4, 1.2])
我知道如何从行开始创建一个多列数据框,并且我知道如何创建一个多索引数据框。但是我怎样才能同时创建呢? 谢谢
【问题讨论】:
-
df.reset_index().to_numpy() ?
-
如何开始?您是否已经在空数据框中拥有多索引索引和列?
-
我认为 OP 想朝另一个方向发展。
-
老实说,我可以以任何方式开始。重要的是,在某些时候我有这些行,我需要从中构建一个数据框,使用第一个 x 元素作为索引,另一个作为多列方式的值。也是的,我想从 numpy 转到 pandas :) 编辑:Ben,如果我理解你的问题,我有列名和多索引名称,而不是所有可能的索引。
-
这还取决于您希望/需要如何创建数据框。您需要逐一更新行吗?或者您是否拥有所有行并想一次创建数据框?
标签: python pandas dataframe multi-index