【发布时间】:2021-08-12 17:04:35
【问题描述】:
我有一个尺寸为(20000,3000) 的熊猫数据框,我希望有一些重复的列,但它们有不同的标题。我将如何删除这些重复项但将原始列保留在 pandas 中
【问题讨论】:
-
这能回答你的问题吗? python pandas remove duplicate columns。还有一些解决方案不依赖于列名,而只依赖于值(你想要的)。
我有一个尺寸为(20000,3000) 的熊猫数据框,我希望有一些重复的列,但它们有不同的标题。我将如何删除这些重复项但将原始列保留在 pandas 中
【问题讨论】:
您可以使用以下方法根据其值删除重复的列:
df=df.T.drop_duplicates().T
如下:
import pandas as pd
df = pd.DataFrame(
{'A': [2, 4, 8, 0],
'B': [2, 0, 0, 0],
'B_duplicated': [2, 0, 0, 0],
'C': [10, 2, 1, 8]})
df = df.T.drop_duplicates().T
这将导致:
A B C
0 2 2 10
1 4 0 2
2 8 0 1
3 0 0 8
【讨论】: