【发布时间】:2021-06-10 17:15:38
【问题描述】:
Kaplan Meier 方法和逻辑回归都有自己的特征选择。我想使用另一种方法来选择最佳特征,例如,反向逐步特征选择。是否可以改用这种方法。
我的数据包含 130 多个特征和大约 3000 个人。由于是医学 [癌症] 数据,我不想使用简单的方法。
可以在此处查看有关该项目的更多信息,并且按我应该做什么的顺序排列:
- 预处理数据
- 将它们分开进行测试和训练
- 训练数据的数据插补
- 按训练数据选择特征
- 训练模型是 Kaplan Meier 和 Logistic 回归
- 测试模型
请告诉我,为他们使用任何其他功能选择是否是错误的? 我也可以使用关于我列出的模型的任何提示。
【问题讨论】:
标签: logistic-regression feature-selection