【问题标题】:Unique columns pandas [duplicate]唯一列熊猫[重复]
【发布时间】:2021-08-12 17:04:35
【问题描述】:

我有一个尺寸为(20000,3000) 的熊猫数据框,我希望有一些重复的列,但它们有不同的标题。我将如何删除这些重复项但将原始列保留在 pandas 中

【问题讨论】:

标签: python pandas dataframe


【解决方案1】:

您可以使用以下方法根据其值删除重复的列:

df=df.T.drop_duplicates().T

如下:

import pandas as pd

df = pd.DataFrame(
            {'A': [2, 4, 8, 0],
            'B': [2, 0, 0, 0],
            'B_duplicated': [2, 0, 0, 0],
            'C': [10, 2, 1, 8]})

df = df.T.drop_duplicates().T

这将导致:

A  B   C
0  2  2  10
1  4  0   2
2  8  0   1
3  0  0   8

【讨论】:

    猜你喜欢
    • 2016-07-06
    • 2017-05-30
    • 1970-01-01
    • 1970-01-01
    • 2018-03-19
    • 2015-01-14
    • 2020-02-02
    • 2021-08-03
    • 2021-03-17
    相关资源
    最近更新 更多