【发布时间】:2018-08-26 20:34:26
【问题描述】:
我正在尝试预测处理推荐电影的二元分类问题。
我有一个 50 行(电影)和 6 列(5 个电影属性和对电影的共识)的训练数据集。
然后我有一个包含相同列的 20 部电影的测试数据集。
然后我跑
pred<-predict(svm_model, test)
并接收
predict.svm(svm_model, test) 中的错误:测试数据与模型不匹配!。
从类似的帖子来看,错误似乎是因为训练数据集和测试数据集之间的级别不匹配。这是真的,我通过比较str(test) 和str(train) 证明了这一点。但是,这两个数据集都来自随机选择的电影,并且它们的分类属性总是具有不同的级别。正在做
levels(test$Attr1) <- levels(train$Attr1)
更改测试中的实际列数据,从而使预测器不正确。有谁知道如何解决这个问题?
我的训练集的前半打行在以下链接中。 https://justpaste.it/1ifsx
【问题讨论】: