【发布时间】:2014-02-22 17:50:46
【问题描述】:
如何制作一个函数来使用一对或多对值(x1,y1 ; x2,y2 ; ... 根据需要)来对数据框进行子集化
selection <- function(x1,y1, ...){
dfselected <- subset(df, V1 == "x1" & V2 == "y1"
## MAY OR MAY NOT BE PRESENT ##
| V1 == "x2" & V2 == "y2")
return(dfselected)
}
我可以使用subset() 进行单个索引。示例:
df <- data.frame(
V1 = c(rep("a",5), rep("b",5)),
V2 = rep(c(1:5),2),
V3 = c(101:110)
)
即
V1 V2 V3
a 1 101
a 2 102
a 3 103
a 4 104
a 5 105
b 1 106
b 2 107
b 3 108
b 4 109
b 5 110
夫妻 ("a","3") 和 ("b","4") 的子集看起来像
dfselected <- subset(df, V1 == "a" & V2 == 3 | V1 == "b" & V2 == 4 )
我找不到类似的功能。我不知道是否必须将未指定数量的参数传递给函数(所谓的“三个点”)或使用if/else。我是函数的初学者,所以也欢迎链接或示例。
我主要是从这个开始的:http://www.ats.ucla.edu/stat/r/library/intro_function.htm
------------------哈德利回答后的解决方案
selection <- function (x,y){
match <- data.frame(
V1 = x,
V2 = y,
stringsAsFactors = FALSE
)
return(dplyr::semi_join(df, match))
}
【问题讨论】:
标签: r function dataframe subset