【发布时间】:2019-04-17 23:43:58
【问题描述】:
我确定这很简单,我认为这是使用分离和聚集的情况。
我在数据框中有一个字段,作者列表,已编辑的 pubmed 搜索导出。它包含出版物的作者。显然,它可以包含单个作者或作者的合作。
例如,这只是可用选项的选择:
Author
Drijgers RL, Verhey FR, Leentjens AF, Kahler S, Aalten P.
我想做的是创建一个所有作者的列表,这样我就有了类似的东西
Author
Drijgers RL
Verhey FR
Leentjens AF
Kahler S
Aalten P
我该怎么做? 我以为会是这样的
authSpread<-authorlist%>%separate(Author,sep =",",extra ="drop")
但它不起作用。 如果我输入 =“NA” 我只在一个专栏中列出了第一作者。 我想做的是将文本复制到excel中的列函数,您可以在其中指定要拆分的字符,并将单元格的内容投射/传播到新单元格。然后将它们重新收集到一列中。 我不知道作者的最大数量,因此不知道以编程方式分割的列数(或如何标记它们)。
编辑:澄清 我不知道我是否想制作一个长宽的数据框然后收集 - 因为我不知道会生成多少个字段。这是明智之举吗? 我想我可以将“,”分开的输出写入一个列表,然后将该列表的内容写入单个数据框。 这听起来更有效率吗?
【问题讨论】:
标签: r lapply tidyverse tidyr sapply