【发布时间】:2020-10-17 19:07:08
【问题描述】:
我的数据集看起来像这样 姓名 昵称 1 (弗朗茨) Xaver Vere/i, Verl, Xare, Xav(i), Xaverl, Xide 3 阿道夫 Do(i)lfal, Do(i)lferl 4 阿道夫、阿达尔伯特、阿德里安·阿德/我 5 亚历山大·赞德(i)
如您所见,第 3 行和第 4 行包含相同的值,即“Adolf”。第 3 个单元格是单个值,第 4 个单元格是多值单元格,我需要将这两个单元格组合起来,以使数据框显示每个名称的所有可能昵称以及哪些名称可以具有相同或相似的昵称一排
所以应该是这样的 姓名 昵称 3 阿道夫、阿达尔伯特、阿德里安 Do(i)lfal、Do(i)lferl、Ade/i
另外,有谁知道如何在同一个单元格中将“Do(i)lfal”之类的值更改为“Dolfal,Dilfal”,并将“Ade/i”更改为“Ade,Adi”
我只能用Base R来解决这个问题,我很挣扎。 非常感谢。
【问题讨论】:
-
您在寻找任何单词匹配吗?括号内也有一些单词。假设在另一行有一个没有括号的“Franz”,它们会被组合在一起
标签: r aggregate-functions