【发布时间】:2016-12-02 04:21:34
【问题描述】:
我正在尝试使用从 GPS 中提取的点数据集来训练我的 svm 算法。我的数据实例(例如 x1、x2、x3、... xn)具有一组属性(速度、坐标等)。我将两个数据实例(点)之间的线视为一个片段,并且我正在尝试使用多个特征(属性)和移动顺序来训练我的算法。考虑到我将数据保存在 CSV 文件中,我想做的是:
1st row: x1(speed, lon, lat), x2(speed,lon, lat), x3(speed,lon, lat)
2nd row:x2, x3, x4
3rd row: x3, x4, x5
等等。
通过这样做,我将训练我的算法来学习序列,这就是我正在尝试做的事情。 我的问题是;我将如何以序列的形式训练它?以及这个序列如何包含多个特征?
我热衷于使用 R 或 Python,尽管我更熟悉 R。据我所知 Python 中的 sklearn 库也可能有用,但我不明白培训的形式set 必须训练 svm。 任何帮助将非常感激。 谢谢
【问题讨论】:
-
SVM 是一种分类器——它学习从特征向量
x到标签向量y的映射。在这种情况下,您试图预测的标签是什么? “学习序列”究竟是什么意思? -
嗨 ali_m,感谢您的回复。标签实际上是 1 或 0。我想做的是研究关于这些 GPS 点的行为。所以认为 1 是正常行为,0 是异常行为。但是可能有一个异常的子序列,而不是整个事件序列本身。这就是我尝试这样做的原因。