【发布时间】:2015-05-04 13:38:09
【问题描述】:
我正在使用这个站点 http://scikit-learn.org/stable/datasets/(副标题 5.5)来创建我的自定义数据集,以使用 scikit 执行 SVM。我一天的总结:我基本上不知道我在做什么。
对于我的论文,我想预测股票回报方向,即 SVM 的输出应该是 1 (UP) 或 -1 (DOWN)。目前我正在尝试用随机样本找出 SVM(因为我确实了解教程的工作原理)。
正如在提到的网站上所说,每一行都采用<label> <feature-id>:<feature-value> <feature-id>:<feature-value> 的形式,我认为我提供的训练集应该采用相同的格式。因此,我在 Notepad++ 中创建了以下训练样本:
<1> <1>:<0>, <1>:<19260800>, <1>:<77.83>
<1> <2>:<-1>, <2>:<20110000>, <2>:<75.78>
<-1> <3>:<1>, <3>:<53306400>, <3>:<76.24>
<1> <4>:<0>, <4>:<61293500>, <4>:<78.00>
<-1> <5>:<-1>, <5>:<42649500>, <5>:<75.91>
例如第二行:
表示股票从前一天开始上涨, 是第二行的数据, 是特定公司当天的负面 Twitter 情绪, 是当日股票成交量,为当日调整收盘价。
我希望你明白我想说什么。我希望更多的人可以帮助我。
提前致谢!
【问题讨论】:
标签: python machine-learning scikit-learn svm