【发布时间】:2017-06-27 18:25:56
【问题描述】:
我有调查数据——称之为survey——一组人回答了问题。我有每个人的名字、他们回答的问题和他们的回答,都是很长的形式(每个人的名字重复了几十次,每个问题一次)。
员工姓名 |问题 |回答
在第二个数据框中——称之为metaData——我有关于问题子集的额外数据
员工姓名 |问题 |问题评估 |问题学习计划|等等。
两个数据集共享 Employee Name 和 Question 列,应该完全匹配。
我需要merge() 这两个数据框,但员工姓名和问题都不足以合并。当您结合问题和员工姓名时,这是一个唯一的 ID。在伪代码中,merge(survey, metaData, where(employeeSurvey == employeeMeta && questionSurvey == questionMeta)。
例如,仅合并员工姓名会返回数百个匹配项,但应该只有一个员工姓名和问题相等。
如何根据这两个条件进行合并?
【问题讨论】:
标签: r merge transformation