【问题标题】:Merging dataframes with duplicate indices合并具有重复索引的数据框
【发布时间】:2013-09-22 02:24:50
【问题描述】:

在 python 的 pandas 包中的以下示例中,当合并两个具有重复/公共索引的数据帧时,这些索引是 http://pandas.pydata.org/pandas-docs/dev/10min.html#join

是否可以像下面这样合并它:

     key  lval    rval
  0  foo     1,2     4,5

如果 1,2,4,5 是字符串,会有所不同吗?

【问题讨论】:

    标签: python pandas


    【解决方案1】:

    我不建议使用这种数据结构,我希望有更好的方法取决于您分析的下一阶段是什么......

    这么说,这是一种方法。为每个键获取一系列列表:

    In [11]: l = left.groupby('key')['lval'].apply(list)
    
    In [12]: l.name = 'lval'
    
    In [13]: l
    Out[13]:
    key
    foo    [1, 2]
    Name: lval, dtype: object
    
    In [14]: r = right.groupby('key')['rval'].apply(list)
    
    In [15]: r.name = 'rval'
    

    然后将它们连接成一个DataFrame:

    In [16]: pd.concat([l, r], axis=1)
    Out[16]:
           lval    rval
    key
    foo  [1, 2]  [4, 5]
    

    【讨论】:

    • 谢谢,这帮助我正确地合并了我的表格。我的数据包含字符串,我不打算对其进行更多计算。如果需要,我可能会进一步解析它。再次感谢。
    猜你喜欢
    • 1970-01-01
    • 2015-02-10
    • 2016-10-16
    • 1970-01-01
    • 2015-09-08
    • 1970-01-01
    • 1970-01-01
    • 2018-03-15
    • 1970-01-01
    相关资源
    最近更新 更多