【问题标题】:Removing columns in Pandas删除 Pandas 中的列
【发布时间】:2020-11-02 17:22:05
【问题描述】:

我在一个大型 Python 数据框上工作,并注意到某些列的每一行具有相同的值列的名称不同。 此外,一些值是文本或时间序列数据。

有什么简单的方法可以摆脱这些重复的列并每次都保持在第一位吗?

非常感谢

【问题讨论】:

标签: python dataframe duplicates


【解决方案1】:

让我们创建一个虚拟数据框,其中两个不同名称的列是重复的。

import pandas as pd
df=pd.DataFrame({
    'col1':[1,2,3,'b',5,6],
    'col2':[11,'a',13,14,15,16],
    'col3':[1,2,3,'b',5,6],
     
     })

    col1    col2    col3
0   1       11      1
1   2       a       2
2   3       13      3
3   b       14      b
4   5       15      5
5   6       16      6

要删除重复的列,首先进行转置,然后应用 drop_duplicate 并再次进行转置

df.T.drop_duplicates().T

结果

    col1    col2
0   1       11
1   2       a
2   3       13
3   b       14
4   5       15
5   6       16

【讨论】:

  • 感谢 Talha,无需放置 inplace=true somehwere 即可明确修改原始 df?
  • 是的,你可以放置它,如果你想替换原来的df而不是创建一个新的
  • 我可以把它放在哪里?
  • df.T.drop_duplicates(inplace=True).T
猜你喜欢
  • 2016-10-01
  • 2020-09-29
  • 2021-07-04
  • 1970-01-01
  • 1970-01-01
  • 2018-05-01
  • 2020-02-10
相关资源
最近更新 更多