【发布时间】:2021-09-11 17:17:13
【问题描述】:
这里是原始程序员。我的任务是清理以 csv 格式存储的医疗数据。
(请记住,当您阅读本文时,我只是一个初级程序员,因此感谢您的耐心等待)
我有一个文件,我们称之为data1,它看起来像这样: data1。它有大约 17,000 行/患者
inc_key 指的是唯一的患者 ID。
我有另一个文件,我们将其称为 data2,它的格式相同,只是其中存储了不同的信息,但它包含数百万行/患者。
我的目标是,对于data1中的每一行/患者,我需要在data2中找到匹配的患者(inc_key值),然后将相应的信息附加(添加到该患者的末尾)到同一患者中数据1。
也就是说,我需要合并这两个文件,除了inc_key值需要匹配。
我正在使用 pandas 模块,有人可以帮我解决这个问题吗?
提前感谢任何提供帮助的人,由于我只是初学者,因此非常感谢。
【问题讨论】:
-
data1.merge(data2, on='inc_key') -
您正在寻找 pandas 合并。 pandas.pydata.org/pandas-docs/stable/reference/api/…
-
这能回答你的问题吗? Pandas Merging 101
标签: python pandas database dataframe csv