【问题标题】:Drop duplicate in multiindex dataframe in pandas在熊猫的多索引数据框中删除重复项
【发布时间】:2016-06-23 15:02:52
【问题描述】:

我正在寻找一种有效的方法来使用 Pandas 删除多索引数据框中的重复列。

我的数据:

TypePoint      TIME     Test   ...         T1      T1
-                 S    Unit1   ...       unit    unit
(POINT, -)                     ...                   
24001         90.00  100.000   ...     303.15  303.15
24002        390.00  101.000   ...     303.15  303.15
            ...      ...   ...        ...     ...
24801         10000  102.000   ...     303.15  303.15
24802         10500  103.000   ...     303.15  303.15

标头包含两个信息。变量的名称及其单位。 我想删除变量“T1”(重复变量)。

  • .drop_duplicates() 不起作用。我收到“缓冲区的维数错误(预期为 1,得到 2)”错误。

  • .drop(Data('T1','unit'),axis=1) 也不起作用。这会删除两列,而不仅仅是其中之一。

感谢您的帮助

【问题讨论】:

    标签: python pandas multi-index


    【解决方案1】:

    我认为你可以使用双 T:

    print df
      TypePoint   TIME  Test      T1        
              -      S Unit1    unit    unit
    0     24001     90   100  303.15  303.15
    1     24002    390   101  303.15  303.15
    2     24801  10000   102  303.15  303.15
    3     24802  10500   103  303.15  303.15
    
    print df.T.drop_duplicates().T
      TypePoint   TIME  Test      T1
              -      S Unit1    unit
    0     24001     90   100  303.15
    1     24002    390   101  303.15
    2     24801  10000   102  303.15
    3     24802  10500   103  303.15
    

    【讨论】:

      猜你喜欢
      • 2022-11-01
      • 1970-01-01
      • 2018-01-02
      • 1970-01-01
      • 2015-06-13
      • 1970-01-01
      • 2020-03-24
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多