【发布时间】:2020-09-04 17:43:02
【问题描述】:
我创建了以下函数来查找与目标相关的列。为此,该函数应用于 diamonds 数据集(此处分配给 dt)。
select_variables_gen <- function(variable, target = dt$price, threshold = 0.9){
if(all(class(variable) %in% c("numeric","integer"))){
corr <- abs(cor(variable, target));
if(corr > threshold){
return(T);
}else{F}
}else{F}
};
现在我想应用函数,但不知道如何指定函数的参数。这是我尝试过的
alt_selected_gen <- names(dt)[sapply(dt,
select_variables(variable = dt, target = dt$carat, threshold = 0.1))]
alt_selected_gen;
返回一个错误,指出第二个和第三个参数未使用。如何使用该函数(使用 sapply 或任何其他方式)来指定参数?
我想要的输出是相关性高于阈值的列的列名。所以在上面的代码中使用默认值就是;
[1] "carat" "price"
【问题讨论】: