【发布时间】:2017-11-09 07:53:31
【问题描述】:
在 python pandas 我有一个数据框
df_aaa:
date data otherdata symbol
2015/1/1 11 12 aaa
2015/2/1 21 22 aaa
2015/3/1 31 31 aaa
df_all:
2015/1/1 31 31 bbb
目前两者的索引是date。
我想将 df_aaa 附加到 df_all,并让它们带有符号和日期的复合索引。
- 我该怎么做?
基本上以下都是一个问题:如何设置多索引并在追加时使用它。我可以用不同的列顺序吗?我需要刷新吗?等等:
我不确定
multi-index是否是具有多个“列”(或行)的索引,或者它是否能够拥有多个索引(其中任何一个都可以用于多个列或行)。或者两者都是正确的?我必须首先将两个数据帧的索引设置为多索引,这样追加才能起作用吗? (否则我会有不同符号的重复项
在创建新索引之前是否必须“删除”现有索引?
有没有数据但没有索引的数据框这样的东西?
(单个)索引必须具有唯一值吗?
我什么时候使用以下哪种数据框方法:
set_index()、reindex()、reset_index()、set_level、reset_level?- 当我给这些方法一个数组时,默认值是什么。 Python 文档令人生畏,我在其中找不到我的手或腿。举一些好的例子会有所帮助......
设置索引时是否需要添加任何内容(如
axis=1)?如何将索引设置为列中的数据。 (为什么有时使用 ['symbol', 'date'] 作为参数,给我一个包含这两个值的新列,而不是在具有这两个名称的列的现有值上设置索引?)
1234563索引?
1234563 (比如:['symbol', 'date', 'data', 'otherdata'] 符号第一列)?
【问题讨论】: