【发布时间】:2020-02-14 09:17:56
【问题描述】:
我是(新手)使用 R 和正则正则表达式来编写用于在 data.frame 列中操作字符串的正则表达式。我的数据在 R 中如下所示:
c1
Peter Parker
Hawk & Dove
J Jonah Jameson
3JPX spo
Bruce Wayne
我想要得到的是包含以下字符串的第二列“c2”:
c2
PeterP
Hawk&D
JJJ
3JPXs
BruceW
基本上我想要字符串的整个第一个单词(不管长度)和之后每个单词的第一个字母数字元素。我无法为此找到任何功能或逻辑。可以用正则表达式这样做吗?
提前致谢
【问题讨论】:
-
顺便说一句,你的意思是
c2来自c1,还是打错字? -
是的。我希望列 c2 中的值来自列 c1 中的值
-
啊,列名。我不认为那是
data.frame或matrix。有时,以更明确的格式提供数据(例如以编程方式使用data.frame(...)或dput(x))既有用(对我们而言)又绝对清晰;虽然后者看起来不那么棒,但它可以用最少的努力(就我们而言)给出一个完全相同的对象。 -
我确实说过这是问题标题中的 data.frame 列。但下次我也会使用“data.frame(...)”表示法。 :) 谢谢
-
对我不好,谢谢。 (我发现多行标题有点忙,所以我一定是浏览得太快了。下次我会努力的:-)