【发布时间】:2018-10-12 15:19:04
【问题描述】:
我有一个大数据框,我想根据字符串的长度对数据框进行子集化。
我对每一行都有字符限制和优先顺序。
例如:
Column1 Column2 Column3 Column4
A1 Hotels in London, UK Hotels in London Hotels
如果 len(column2)
即我的偏好是 column2 > column3 > column 4,但这些都受 30 个字符的限制。
目前,我有一个循环需要
for(i in 1:nrow(df) {
if(nchar(df$`C2`[i]) <= 30) {
df[i]$`selected` <- df`C2`[i]
} else if(nchar(df$`C3`[i]) <= 30) {
df$`selected`[i] <- df$`C3`[i]
} else (nchar(df$`C4[i]) <= 30) {
df$`selected`[i]<- df$`C4`[i]
【问题讨论】: