【发布时间】:2023-10-24 05:17:01
【问题描述】:
我目前正在从事一个小型机器学习项目。 该任务处理数千名患者的医疗数据。对于那里的每位患者,每隔一小时对同一组生命体征进行 12 次测量。 这些测量必须注意在患者进入医院后立即进行,但可以从一些偏移量开始。但是病人总共要在医院呆24小时,所以他们不能迟于入院后11小时后开始。
现在的任务是为每位患者预测在剩余的住院期间是否会进行 10 项可能的测试中的一项或多项测试,并预测在剩余时间里某些生命体征的未来平均值逗留。 我有一个训练集,其中包含我应该预测的标签。
我的问题主要是关于如何处理这些特征,我考虑将患者的测量结果转换为一个长向量并将其用作分类器的训练示例。 但是我不太确定如何将每次测量的时间信息包含到特征中(我是否应该考虑时间?)。
【问题讨论】:
标签: machine-learning classification prediction feature-selection feature-engineering