【发布时间】:2021-09-16 18:43:10
【问题描述】:
我有 2 个数据框,其中包含帐号和金额以及其他一些不相关的列。如果匹配与否,我想将输出与 Y 或 N 进行比较。
我需要将数据框 A 中第 1 行中的帐号与数据框 B 中第 1 行中的帐号进行比较,如果它们匹配,则将 Y 放在列中,如果不匹配,则将 N 放在列中。我已经设法获取代码来检查整个数据框中是否存在匹配项,但我需要单独检查每一行。
例如
df1
|account.num|x1|x2|x3|
|100|a|b|c|
|101|a|b|c|
|102|a|b|c|
|103|a|b|c|
df2
|account.num|x1|x2|x3|
|100|a|b|c|
|102|a|b|c|
|101|a|b|c|
|103|a|b|c|
输出
|account.num|x1|x2|x3|匹配|
|100|a|b|c|Y|
|101|a|b|c|N|
|102|a|b|c|N|
|103|a|b|c|Y|
因此,第 1 行匹配,因为它们具有相同的帐号,但第 2 行不匹配,因为它们不同。但是,数据框中的其他数据与该列无关。我可以在不合并数据框的情况下执行此操作吗? (我确实有桌子,但它们不起作用。我不知道为什么。如果这很难理解,请见谅)。
【问题讨论】:
-
如果您包含一个简单的reproducible example,其中包含可用于测试和验证可能解决方案的示例输入和所需输出,则更容易为您提供帮助。听起来你需要merge your data
-
comparedf是您正在寻找的功能。 cran.r-project.org/web/packages/arsenal/vignettes/…
标签: r