【发布时间】:2016-07-24 13:45:18
【问题描述】:
在 pandas 中合并多个数据帧(即超过 2 个)的最有效方法是什么?有几个答案:
- pandas joining multiple dataframes on columns
- Pandas left outer join multiple dataframes on multiple columns
但这些都涉及多个连接。如果我有 N 个数据帧,这些将需要 N-1 个连接。
如果我不使用 pandas,另一种解决方案是将所有内容放入基于公共索引作为键的哈希表中并构建最终版本。我相信这基本上就像 SQL 中的哈希连接。大熊猫中有类似的东西吗?
如果不是,那么仅使用公共索引创建一个新数据框并将每个数据框的原始数据传递给它会更有效吗?看起来这至少会阻止您在每个 N-1 连接中创建一个新的数据框。
谢谢。
【问题讨论】:
-
你打算如何加入他们?在索引上?内连接还是左/外连接?