【发布时间】:2023-03-13 17:52:01
【问题描述】:
我有一个包含m、k(均为数字)、startTimeStamp(Posix)和isProcessActive(真/假)的数据模型
我收集这些数据超过 5 天,每行代表一分钟,大约 300 分钟的数据。 (有些日子会丢失)。删除了 EndTimeStamp 列,因为 glm 摘要对于这个数据点来说是微不足道的。
IsProcessActive 基于任一
-
m或k> 500 - 先前和当前
startTimeStamp之间的差异> 65 秒或m 或k可以为0 或大于0。
样本数据:
m k startTimeStamp IsProcessActive
550 0 1st March 2018, 11:00AM 1
1550 11 1st March 2018, 11:02AM 1
5 0 1st March 2018, 11:05AM 1
50 50 1st March 2018, 11:06AM 0
0 0 1st March 2018, 11:08AM 0
0 0 1st March 2018, 11:18AM 1
使用带有二项式链接的 glm,输出预测适用于 m 和/或 k 的任何/所有组合。但总是无法预测 startTimeStamp 差异 > 65 秒,m & k 为 0。
希望我能清楚地解释自己。请帮忙。
【问题讨论】:
标签: r machine-learning logistic-regression