【发布时间】:2017-09-26 19:33:06
【问题描述】:
我有两个具有相同结构的数据框 - 都有两个 ID 列和 25 个字符串数据列。当 ID 匹配时,我想将两者连接起来并连接数据列中的字符串。所以,例如:
df_1:
id_1 id_2 col_1 col2 ... col_25
a1 b1 A A ... <NA>
a1 b2 A <NA> ... A
a2 b1 <NA> <NA> ... A
df_2:
id_1 id_2 col_1 col2 ... col_25
a1 b1 B <NA> ... <NA>
a1 b2 <NA> B ... B
a1 b3 B <NA> ... B
结合起来,这应该给
df_combined:
id_1 id_2 col_1 col2 ... col_25
a1 b1 A, B A ... <NA>
a1 b2 A B ... A, B
a1 b3 B <NA> ... B
a2 b1 <NA> <NA> ... A
当我尝试使用联接或合并时,它会重复除 ID 列之外的所有内容(因此我最终得到 50 个数据列)。我需要使用其他东西吗?
谢谢!
【问题讨论】:
-
rbind 2 个数据帧,然后按 id 分组,遍历列并粘贴。看到这个帖子group by paste for one column
-
如果您提供“即用型数据”,ppl 很乐意为您提供帮助。尽管问题很清楚。 +1