【发布时间】:2017-07-08 23:55:12
【问题描述】:
我是机器学习领域的新手,我有一个这种结构的 excel 表:
Columns = {date, ..., Inflation}
第一列是日期,接下来的列是数字,最后一列是小数的通货膨胀。
date ... Inflation
01/06/2016 ... -0.07363739
01/07/2016 ... -0.07363741
问题是我被要求对这些预测数据应用一些分类算法,例如(朴素贝叶斯、kNN、SVM,也许还有其他),并比较这些算法的准确性。
我不明白的是如何从分类的角度处理这些数据?
我用 R 对数据做了一些时间序列,它工作了,但我仍然不能应用分类算法:
dft <- read_excel("./data.xlsx",
sheet = 1)
df <- ts(dft$inflation, frequency=12, start=c(2016,6))
plot.ts(df)
fit <- HoltWinters(df, beta=FALSE, gamma=FALSE)
对于如何使用这些数据进行 R 分类有什么帮助吗? 任何帮助表示赞赏
数据样本:https://drive.google.com/open?id=0B1gJg-F8Gb76a1N3NVBXNFd1bjg
【问题讨论】:
-
你应该更具体一些,你到底想预测什么?顾名思义,分类对类起作用。如果你想预测一个连续变量,你正在做回归。请添加有关您的问题到底是什么的更多详细信息。
-
目标变量是“通货膨胀”,所以这是我们需要预测的,我可以分享部分数据吗?
标签: r classification