【发布时间】:2020-02-03 22:35:50
【问题描述】:
我正在尝试使用两个单独的列名合并两个数据集,但它们共享相同的唯一值。例如,数据集 1 中的列 A == xyzw,而在数据集 2 中,列的名称是 B,但值 == xyzw。
但是,问题在于,在数据集 2 中,列的 B 值 == xyzw 指的是公司名称并出现多次,具体取决于数据集中存在该公司的员工数量。
基本上,我想创建一个新列,我们在数据集 1 中将其称为 C,告诉我每个公司有多少员工。
我尝试了以下方法:
## Counting how many teachers are in each matched school, using the "Matched" column from matching_file_V4, along with the school_name column from the sample11 dataset:
merged_dataset <- left_join(sample11,matched_datasets,by="school_name")
虽然此代码有效,但它并没有真正为我提供每家公司的员工人数。
【问题讨论】:
标签: r dplyr left-join tidyverse