【发布时间】:2020-09-07 18:50:59
【问题描述】:
我有一个包含不同数据框的列表。我需要将相同的数据框合并 列名称合二为一,并将其写入 CSV 输出或单个数据帧。
我设法获得了列名,但想不出好的逻辑来执行上述操作 操作。
我的情况:
有 9 个数据框元素的 MERGED_LIST。列名如下
array(['A','B','C']) - 10 rows
array(['A','B','C']) - 15 rows
array(['W','X','Y','Z']) - 10 rows
array(['W','X','Y','Z']) - 20 rows
array(['W','X','Y','Z']) - 45 rows
array(['W','X','Y','Z']) - 30 rows
array(['W','X','Y','Z']) - 5 rows
array(['H']) - 50 rows
需要最终输出:
CSV1 或 DF1:
A B C
25 行
CSV2 或 DF2:
W X Y Z
110 行
CSV3 或 DF3:
H
50 行
【问题讨论】:
-
您尝试使用
pd.concat吗? -
@AntonProtopopov...我已经考虑过用于单个数据帧的 pd.concat 并且更早得到它。在这里,我正在寻找列匹配(因为它们是数组)逻辑方面的帮助。我有一个想法在高级别,但由于我是 python 新手,无法正确构建它。我的逻辑如下: 1. 分别添加第一个数据框。 2.读取第二个数据帧的列并与第一个比较 3.如果列匹配,则附加到较早的数据帧。 4 再次循环 5.如果列不匹配创建单独的数据框并循环直到实现。请帮助
-
@SergeyAntopolskiy 我正在努力并会发布
-
@marupav 所以让我直说吧。您需要一种自动化的方式来查看哪些原始数据框与列匹配,并为每个集群输出单独的组合数据框?另一个问题:是否存在部分匹配(例如,在列上匹配,其他不匹配)?在这种情况下你想做什么?