删除 Pandas 中的列

【问题标题】：Removing columns in Pandas删除 Pandas 中的列
【发布时间】：2020-11-02 17:22:05
【问题描述】：

我在一个大型 Python 数据框上工作，并注意到某些列的每一行具有相同的值但列的名称不同。此外，一些值是文本或时间序列数据。

有什么简单的方法可以摆脱这些重复的列并每次都保持在第一位吗？

非常感谢

【问题讨论】：

值是部分重复还是完全重复？
尽我所见（300 000 行），包括格式
欢迎来到 SO。请阅读stackoverflow.com/help/mcve 并发布您尝试的代码。
这能回答你的问题吗？ python pandas remove duplicate columns

标签： python dataframe duplicates

【解决方案1】：

让我们创建一个虚拟数据框，其中两个不同名称的列是重复的。

import pandas as pd
df=pd.DataFrame({
    'col1':[1,2,3,'b',5,6],
    'col2':[11,'a',13,14,15,16],
    'col3':[1,2,3,'b',5,6],
     
     })

    col1    col2    col3
0   1       11      1
1   2       a       2
2   3       13      3
3   b       14      b
4   5       15      5
5   6       16      6

要删除重复的列，首先进行转置，然后应用 drop_duplicate 并再次进行转置

df.T.drop_duplicates().T

结果

    col1    col2
0   1       11
1   2       a
2   3       13
3   b       14
4   5       15
5   6       16

【讨论】：

感谢 Talha，无需放置 inplace=true somehwere 即可明确修改原始 df？
是的，你可以放置它，如果你想替换原来的df而不是创建一个新的
我可以把它放在哪里？
df.T.drop_duplicates(inplace=True).T