【发布时间】:2016-11-26 22:27:48
【问题描述】:
我在不同目录中有同名的 csv 文件,我想将它们合并为一个 csv。
目录1 abcd__diff.csv efgh__diff.csv 目录2 abcd_diffhere.csv efgh_diffhere.csv 手术 dir1/abcd_diff.csv 加入 dir2/abcd_diffhere.csv dir1/efgh_diff.csv 加入 dir2/efgh_diffhere.csv我想使用公共字段合并它们。我可以使用 pandas join 运算符,但是跨目录搜索和映射文件名的最有效方法是什么。 我使用字符 __ 拆分文件名,给出每个目录中具有相同名称的文件列表。我可以执行两个 for 循环并进行迭代,但这效率不高,因为我有大约 200 个文件。
【问题讨论】:
-
每对会合并成多个dfs吗?还是对合并并附加到最终的大df?
-
每一对都合并成一个独特的新数据框,所以最后我有多个数据框。
标签: python csv pandas join merge