唯一列熊猫[重复]

【问题标题】：Unique columns pandas [duplicate]唯一列熊猫[重复]
【发布时间】：2021-08-12 17:04:35
【问题描述】：

我有一个尺寸为(20000,3000) 的熊猫数据框，我希望有一些重复的列，但它们有不同的标题。我将如何删除这些重复项但将原始列保留在 pandas 中

【问题讨论】：

这能回答你的问题吗？ python pandas remove duplicate columns。还有一些解决方案不依赖于列名，而只依赖于值（你想要的）。

【解决方案1】：

您可以使用以下方法根据其值删除重复的列：

df=df.T.drop_duplicates().T

如下：

import pandas as pd

df = pd.DataFrame(
            {'A': [2, 4, 8, 0],
            'B': [2, 0, 0, 0],
            'B_duplicated': [2, 0, 0, 0],
            'C': [10, 2, 1, 8]})

df = df.T.drop_duplicates().T

这将导致：

A  B   C
0  2  2  10
1  4  0   2
2  8  0   1
3  0  0   8

【讨论】：