【发布时间】:2019-04-02 11:12:27
【问题描述】:
专家!
我正在训练数据集上测试逻辑回归模型。我知道“预测”功能可以告诉我一个独特事件发生的概率(type="response")(在这种情况下,一名员工离开了公司)。
我还知道 2019 年 1 月发布了一个名为“Tidypredict”的新包,它还可以预测事件以 95% 的间隔发生的概率。
当我尝试这两种不同的方法时,它显示同一员工的不同概率。
我研究了这个话题。似乎使用“预测”功能的最佳时机是当最终结果已知时。因为我们可以比较并找出模型的准确度。
当结果未知时使用“Tidypredict”函数。谁能告诉我有什么区别? 以下是现成的信息:https://cran.r-project.org/web/packages/tidypredict/tidypredict.pdf
预测:https://stat.ethz.ch/R-manual/R-devel/library/stats/html/predict.glm.html
Here is the results for anyone interested:
test model:
1 2 3 4 5 6
0.6633092 0.2440294 0.2031897 0.9038319 0.8374229 0.1735053
Tidypredict:
Age Los Gender Minority test.model fit
1 xx.xx ThreeToFive Male Minority 0.6633092 0.7116757
2 xx.xx ZeroToOne Male Minority 0.2440294 0.6834286
3 xx.xx ZeroToOne Female Minority 0.2031897 0.6303713
4 xx.xx TentoTwenty Male Minority 0.9038319 0.6963801
5 xx.xx ThreeToFive Male Minority 0.8374229 0.8658365
6 xx.xx ZeroToOne Female Minority 0.1735053 0.5840209
#logistic model#
model1=glm(Leave~.,family="binomial",data=train)
#Predict function#
test.model<-predict(model1,newdata=test1,type="response")
#Tidypredict function#
emp_risk<-test1%>%
tidypredict_to_column(model1)
【问题讨论】:
-
df和test1是同一个数据帧吗?也许这就是你得到不同结果的原因。 -
我刚刚更新了代码,很抱歉造成混乱。我来回尝试,忘记更新这里的帖子。
-
能否请您同时发布两个结果的输出
-
我刚做了。结果现在在代码部分中可用。
-
看起来唯一的区别是 tidypredict 返回一个包含输入值和输出预测的数据帧,而 predict 只给你预测。关于何时使用它们,我没有得出与您相同的结论。在我看来,
tidypredict只是使用逻辑回归模型将预测操作通过管道传递回带有 newdata 的数据帧。
标签: r