【问题标题】:Get unique values of multiple columns as a new dataframe in pandas获取多列的唯一值作为熊猫中的新数据框
【发布时间】:2026-02-10 11:50:01
【问题描述】:

拥有至少包含 C1、C2、C3 列的 pandas 数据框 df,您如何将所有唯一的 C1、C2、C3 值作为新的 DataFrame?

换句话说,类似于:

SELECT C1,C2,C3
FROM T
GROUP BY C1,C2,C3

试过了

print df.groupby(by=['C1','C2','C3'])

但我得到了

<pandas.core.groupby.DataFrameGroupBy object at 0x000000000769A9E8>

【问题讨论】:

    标签: python pandas pandas-groupby


    【解决方案1】:

    如果想要所有唯一的三元组,我相信您需要 drop_duplicates

    df = df.drop_duplicates(subset=['C1','C2','C3'])
    

    如果要使用groupby,请添加first

    df = df.groupby(by=['C1','C2','C3'], as_index=False).first()
    

    【讨论】:

      最近更新 更多