【发布时间】:2023-04-05 11:15:01
【问题描述】:
我有这个数据框:
id <- c(1,2,3,4,5)
org <- c(NA, "Org-A", "Org-A;Org-B", "Org-C", "Org-A;Org-B;Org-C")
df <- data.frame(id, org)
我想查找每个 ID 的组织数量。但是这个表中的'Organization'是用分号隔开的,我想要达到的结果:
id org num
1 1 <NA> NA
2 2 Org-A 1
3 3 Org-A;Org-B 2
4 4 Org-C 1
5 5 Org-A;Org-B;Org-C 3
我认为解决这个问题需要这样的东西:
df['num'] = ifelse(is.na(df['org']), NA, ifelse( "something about regex", "count the number of semicolons", 1))
【问题讨论】: