【发布时间】:2018-03-18 17:08:51
【问题描述】:
我正在使用一个包含所有十进制值和时间戳的数据集,它具有以下特性:
1. sno
2. timestamp
3. v1
4. v2
5. v3
我有 5 个月的数据,每分钟都有时间戳。我需要预测将来是否正在使用 v1、v2、v3。 v1,v2,v3 的值在 0 到 25 之间。
我该怎么做?
我以前使用过二进制分类,但我不知道如何处理多标签问题来预测。我一直在使用下面的代码。我应该如何训练模型以及如何使用 v1、v2、v3 来适应“y”?
X_train, X_test, y_train, y_test = train_test_split(train, y, test_size=0.2)
Data:
sno power voltage v1 v2 v3 timestamp
1 3.74 235.24 0 16 18 2006-12-16 18:03:00
2 4.928 237.14 0 37 16 2006-12-16 18:04:00
3 6.052 236.73 0 37 17 2006-12-16 18:05:00
4 6.752 237.06 0 36 17 2006-12-16 18:06:00
5 6.474 237.13 0 37 16 2006-12-16 18:07:00
6 6.308 235.84 0 36 17 2006-12-16 18:08:00
7 4.464 232.69 0 37 16 2006-12-16 18:09:00
8 3.396 230.98 0 22 18 2006-12-16 18:10:00
9 3.09 232.21 0 12 17 2006-12-16 18:11:00
10 3.73 234.19 0 27 17 2006-12-16 18:12:00
11 2.308 234.96 0 1 17 2006-12-16 18:13:00
12 2.388 236.66 0 1 17 2006-12-16 18:14:00
13 4.598 235.84 0 20 17 2006-12-16 18:15:00
14 4.524 235.6 0 9 17 2006-12-16 18:16:00
15 4.202 235.49 0 1 17 2006-12-16 18:17:00
【问题讨论】:
-
短语“我需要预测将来是否使用 v1、v2、v3”应该建议重新编码变量,如果没有出现则等于 0,如果出现则等于 1给定的时刻。不过,我可能错了,因为描述有点模糊。您应该详细说明您的数据。
-
@E.Z.如何将 v1,v2,v3 添加到 y 中?我必须在 X 中添加时间戳、电压、功率,对吗?需要帮助!
-
基本上,是的。您可以通过这种方式形成
X变量。然而,创建y需要修改,因为它还没有明确应该如何初始化。v1 v2 v3背后的故事是什么?换句话说,这些变量是什么意思? -
@E.Z.它们代表不同的类别,对于每个 sno,它可以有一个或多个类别。我该怎么办?
-
那么,没有既定的解决方案。我首先想到的模型会非常复杂。如果您了解这些变量的概念,那么您应该能够创建一个基本理论,说明它们应该如何弥补
y变量。我无法判断我的理论是否可行,因为我对v1 v2 v3代表什么一无所知,但仍然......y可能如下:y = 0如果v1 v2 v3为零;y = 1如果v1 = 1和v2 v3为零,以此类推...这将创建一个多标签变量,该变量可能会在未来拟合。
标签: machine-learning scikit-learn data-science multilabel-classification