【发布时间】:2017-04-05 01:24:21
【问题描述】:
我正在尝试评估回归模型,而不是使用整个测试集,而只使用 X% 的排名靠前的预测,这就是回归的目标。 R中是否有任何允许这样做的包?
例如,如果我有以下情况
x<-c(1,2,3,4,5,8,7,9,12,11,14,15,16,17,20,25,40)
y<-c(0,1,2,4,5,6,8,7,10,12,15,14,13,10,18,22,30)
df<-cbind(x,y)
model<-lm(y~x)
summary(model)
多重 R 平方:0.9432,调整后 R 平方:0.9395
plot(y~x,df)
abline(model)
我想要一个参数“X”(30%),它不是使用 Spearman 的排名相关指数计算的所有数据集,而是仅对前 30% 的数据进行计算。
在这种情况下,它应该只计算x=c(15,16,17,20,25,40)。
这种“部分”相关指数可以帮助进一步表征可能具有较差 R 平方但在域的精确区域(例如 x 的前 X%)中表现更好的模型。
感谢您的任何指示。
【问题讨论】:
-
不完全清楚你想要什么:类似
lm(y~x,data=df,subset=x>quantile(x,0.7))? -
@Ben。谢谢。我不想用更少的数据改变模型,只是在选择的子集上“测量”模型。
标签: r regression correlation