【发布时间】:2020-07-07 06:04:44
【问题描述】:
我目前正在处理一个包含多个 Excel 文件的庞大流行病学数据集。这些文件包含近 3 万名患者的病理学和临床报告。每个患者可以有几个病理和临床报告。患者被分配了一个唯一的 ID。
我想将所有文件合并为一个,以便患者 X001 的 ID 包含所有文件的所有信息。我不能只是复制/粘贴,因为文件中的行数 (ID) 各不相同。
这是我想要完成的一个示例。
我想组合两个列表如下。
如您所见,List1 和 List 2 的行号不同。 list1 中还有一些 ID 在 list2 中找不到,反之亦然。
我想合并它们以使它们对齐和匹配,请参见下图。有人可以为此提供代码吗?我无法手动执行此操作,因为我在 list1 中有 100k 行,在 list2 中有 30k 行...这需要几周时间才能完成,有出错的风险。
【问题讨论】:
-
定义“组合”。你的意思是没有任何重复?如果是这种情况,只需将一个复制到另一个下方,然后使用数据选项卡中的“删除重复项”工具。
-
嗨斯宾塞!允许重复。如果您可以从示例图像中看到我想对齐和匹配两个列表中的 ID。
-
您可以使用 Power Query 并将表转换为查询,然后使用完全外连接将它们合并为一个。
-
好吧,不熟悉那个功能。您能否提供代码并以图像为例?我将永远感激不尽:)
-
重新打开问题后,我可以在下面发布详细答案。目前,您可以在
Data选项卡下找到 Power Query,不需要自定义编码,但是您必须在此过程中进行一些更改/决定才能达到所需的输出。
标签: excel powerquery