【发布时间】:2020-07-10 17:35:39
【问题描述】:
我对 glm 比较陌生 - 所以请多多包涵。
我创建了一个 glm(逻辑回归)来预测个人是继续学习(“0”)还是不继续学习(“1”)。我有兴趣预测后者。 glm 在数据集中使用了七个因素,混淆矩阵非常适合我的需要,并且结合了七年的数据也已经完成。直截了当。
但是,我现在需要将模型应用于当前年份的数据,其中当然没有 NOTCONTINUE 列。假设 glm 模型是“CombinedYears”,新数据是“Data2020”
我如何使用 glm 模型来预测谁会(“0”)或不会(“1”)继续他们的学业?我需要在最新文件中插入一个 NOTCONTINUE 列吗?这个结构我试过了
Predict2020
但输出仅保存值
非常感谢任何帮助。提前谢谢你
【问题讨论】:
-
您正确使用了
predict。您看到的结果是每个给定个体不会继续的概率。如果你的辍学率总体上是 10%,这是完全可能的。假设您有一个模型正确预测掷骰子时掷出 6 的概率为 0.167。因此,如果您掷出 100 个骰子,您预计会得到 16 或 17 个 6。但是,您不能指望模型预测 哪个 骰子是 6。它会告诉你每次投掷的概率。你的模型只能告诉你一个人不会继续下去的概率。 -
谢谢。没有完全意识到这一点,但我现在知道了!对这一级别的统计和学习的新手!