【问题标题】:Pandas extract columns from dataframe which are not present in another dataframePandas 从数据框中提取其他数据框中不存在的列
【发布时间】:2015-04-01 09:19:02
【问题描述】:

我有 2 个数据框:

df_A

A    B    C    D
12   23   34   45
22   32   54   87

和,

df_B

B    C 
23   34
32   54

如何选择 df_A 中不存在于 df_B 中的列,从而产生以下数据框(您可以假设 df_B 是 df_A 的子集):

A    D
12   45
22   87

我试过这个:

df_A[df_A.columns.values <> df_B.columns.values]

但它会导致 KeyError

【问题讨论】:

    标签: python pandas


    【解决方案1】:
    >>> df_A.columns.difference(df_B.columns)
    Index(['A', 'D'], dtype='object')
    

    会给你列,你可以这样做:

    >>> cols = df_A.columns.difference(df_B.columns)
    >>> df_A[cols]
        A   D
    0  12  45
    1  22  87
    

    【讨论】:

      猜你喜欢
      • 2015-05-08
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多