【发布时间】:2019-12-24 01:01:44
【问题描述】:
我正在尝试根据年份从我的数据集中提取某些行,此外,我想对符合以下条件的行进行子串化,对于 2017 年,我想对语句中第二个“-”之前的部分进行子串化,例如:“17Q4-EMEA-All-SOV-OutR-Sov_Score-18Dec.Email”我只想要“All-SOV-OutR-Sov_Score-18Dec.Email”,对于 2018 年,我想删除“。”之后的部分。例如:“IVP 计划模板.IVP 电子邮件模板”我想要“IVP 计划模板”
我尝试过使用
data$col <- sub(".*:", "", data$`Email Name`)
data$col2 <- substring(data$`Email Name`, regexpr(".", data$`Email Name`) + 1)
但它们都不起作用并按原样返回语句,也用于根据我尝试使用过滤器函数的年份进行过滤
filter(data, as.Date(data$First Activity (EDT)) = "2017") 但它给了我语法错误
【问题讨论】:
-
请提供
dput(head(df,n))的数据,而不是图片或链接。 -
请提供预期的输出。
-
这是我的数据集:structure(list(
Email Name= c("IVP 程序模板.IVP 电子邮件模板", "17Q4-EMEA-All-SOV-Global Borrowing_5March18.Email”、“17Q4-EMEA-All-SOV-OutR-Sov_Score-18Dec.Email”、“17Q4-EMEA-All-SOV-Social Housing_8March1.Email”、“17Q4-EMEA-Insurance-Personalized.PersonalizedFI&INS”) ,First Activity (EDT)= 结构(c(12/19/2017,3/5/2018,12/18/2017, 3/9/2018, 12/14/2017), class= c("POSIXct", "POSIXt " ), tzone = "UTC")), row.names = c(NA, -5L), class= c("tbl_df", "tbl", "data.frame")) -
请edit您的问题添加数据,而不是将其放入评论中。除了非常难以阅读之外,评论框还会解释和格式化您输入的文本,这会改变它并使其无法复制
标签: r substring datefilter