【发布时间】:2020-07-12 21:14:03
【问题描述】:
我希望离散化 machine-learning 数据集中的连续特征,特别是使用有监督的 discretisation。原来r [有一个包/方法]1,太棒了!但由于我不精通 R,我遇到了一些问题,如果您能提供帮助,我将不胜感激。
我收到一个错误
类变量需要是一个因素。
我在网上看了一个例子,他们似乎没有这个问题,但我有。注意syntaxV2 ~ .我不太明白,除了V2应该是列名。
library(caret)
library(Rcpp)
library(arulesCBA)
filename <- "wine.data"
dataset <- read.csv(filename, header=FALSE)
dataset2 <- discretizeDF.supervised(V2 ~ ., dataset, method = "mdlp")
R 报如下错误:
.parseformula(formula, data) 中的错误:需要为类变量 一个因素!
您可以在这里找到数据集 wine.data:https://pastebin.com/hvDbEtMN discretizeDF.supervised 的第一个参数是一个公式,这似乎是问题所在。
请帮忙!提前谢谢你。
【问题讨论】:
-
尝试数据$V2
-
感谢您的澄清!这有帮助。顺便说一句,将列设置为一个因子而不是整数解决了这个问题。
标签: machine-learning discretisation r syntax r syntax discretization