【问题标题】:How to reset index in a pandas dataframe? [duplicate]如何重置熊猫数据框中的索引? [复制]
【发布时间】:2013-12-27 17:20:05
【问题描述】:

我有一个数据框,我从中删除了一些行。结果,我得到了一个数据框,其中的索引类似于:[1,5,6,10,11],我想将其重置为[0,1,2,3,4]。我该怎么做?


以下似乎有效:

df = df.reset_index()
del df['index']

以下不起作用:

df = df.reindex()

【问题讨论】:

  • 不是重复的。一个不同的问题恰好有相同的答案。

标签: python indexing pandas dataframe


【解决方案1】:

DataFrame.reset_index 是您正在寻找的。如果您不想将其保存为列,请执行以下操作:

df = df.reset_index(drop=True)

如果您不想重新分配:

df.reset_index(drop=True, inplace=True)

【讨论】:

  • 您可以设置 inplace=True 参数,而不是将数据框重新分配给同一个变量。
  • 请注意,在inplace=True的情况下,该方法返回无
  • 这解决了我在 ValueError 中出现的问题:无法插入 level_0,在多次使用 df = df.reset_index() 时已经存在
  • @mkln,我在两列(即使是drop =True)和行中都增加了。 df.reset_index() 只修复了行。也可以用来固定列吗?
  • 如果我们要删除索引,为什么还要重置它?
【解决方案2】:

另一种解决方案是分配RangeIndexrange

df.index = pd.RangeIndex(len(df.index))

df.index = range(len(df.index))

更快:

df = pd.DataFrame({'a':[8,7], 'c':[2,4]}, index=[7,8])
df = pd.concat([df]*10000)
print (df.head())

In [298]: %timeit df1 = df.reset_index(drop=True)
The slowest run took 7.26 times longer than the fastest. This could mean that an intermediate result is being cached.
10000 loops, best of 3: 105 µs per loop

In [299]: %timeit df.index = pd.RangeIndex(len(df.index))
The slowest run took 15.05 times longer than the fastest. This could mean that an intermediate result is being cached.
100000 loops, best of 3: 7.84 µs per loop

In [300]: %timeit df.index = range(len(df.index))
The slowest run took 7.10 times longer than the fastest. This could mean that an intermediate result is being cached.
100000 loops, best of 3: 14.2 µs per loop

【讨论】:

  • @Outcast Source - 最快的是len(df.index),381ns vs df.shape 1.17us。是不是少了什么?
  • 这是重置索引的优雅解决方案。谢谢!我发现如果您尝试将 hdf5 对象转换为 pandas.DataFrame 对象,则必须先重置索引,然后才能编辑 DataFrame 的某些部分。
【解决方案3】:
data1.reset_index(inplace=True)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-09-18
    • 2019-09-20
    • 2015-02-22
    相关资源
    最近更新 更多