【发布时间】:2020-07-17 23:42:33
【问题描述】:
我可能遇到一个问题,即我的逻辑回归模型的预测函数返回整个数据集的预测,而不仅仅是测试数据。我的测试数据中有 6,931 行。这是我的模型:
test_model <- glm(status2~grade + verified + term + income + revolRatio +totalAcc + totalRevLim + accOpen24 ,data=Loan_test,family="binomial")
这是我的预测函数:
probabilities <- predict(test_model,newdata=Loan_test, type="response")
感谢您对我做错的任何帮助。
好的,这是我将其更改为使用包含约 27000 行的训练数据集:
test_model <- glm(status2~grade + verified + term + income + revolRatio +totalAcc + totalRevLim + accOpen24 ,data=Loan_training,family="binomial")
probabilities <- predict(test_model,newdata=Loan_test, type="response")
但概率仍然包含 34000+ 行。
【问题讨论】:
-
您在看似您的测试数据的基础上构建了模型。这是你的意思吗?
-
是的,我打算这样做。
-
reproducible example 会有所帮助。否则,不清楚您期望模型使用的其他数据是什么,因为您已经构建了模型,现在正尝试基于标记为测试集的同一数据集进行预测
-
这是怎么回事-这是我使用训练数据集构建的原始模式:
-
这是怎么回事 - 这是我使用训练数据集构建的原始模式:
Loantrain_Four <- glm(status2~grade + verified + term + income + revolRatio +totalAcc + totalRevLim + accOpen24 ,data=Loan_training,family="binomial")