【发布时间】:2023-12-07 21:11:02
【问题描述】:
我有一个包含许多简历的数据库,包括每个人的性别、年龄、地址、教育年限和许多其他参数的结构化数据。
对于大约 10% 的样本,我还有关于他们在某个时间点采取的特定行动的额外数据。例如,Jane 于 1998 年 7 月获得房屋贷款,或者 John 于 2007 年 1 月开始飞行员培训并于 2007 年 12 月获得执照。
我需要一个算法,它可以为每个动作给出在未来时间增量中每个人发生的概率。例如,比尔在 2011 年获得住房贷款的机会是 2%,在 2012 年是 3.5%,等等。
我应该如何处理这个问题?回归分析?支持向量机?神经网络?还有什么?
是否有一些标准工具/库可以通过明显的自定义来使用?
【问题讨论】:
-
不要自己尝试这样做。雇用受过良好统计培训的人。
-
称为水晶球算法。
-
我想这也很大程度上取决于您有多少记录(以及这些记录的代表性),您实际上可以推断出有用的预测。
-
你应该在这里问stats.stackexchange.com。但这是一个非常广泛的话题。
-
删除了“线性回归”标签。 OLS 绝对不是要走的路。
标签: neural-network svm prediction statistics