【发布时间】:2020-09-17 04:35:03
【问题描述】:
我正在尝试使用randomForest 命令
我有一个稀疏矩阵,称为计数,包含单细胞表达数据,还有另一个变量 identity,它具有细胞类型
counts <- t(as.matrix(CountsMatrix))
names(counts) <- make.names(names(counts))
smp_size <- floor(nrow(counts)*0.7)
train_ind <- sample(c(1:nrow(counts)), smp_size)
x_train <- counts[train_ind,]
x_test <- counts[-train_ind,]
y_train <- identity[train_ind]
y_test <- identity[-train_ind]
train_set <- cbind(data.frame(Identity = y_train), as.data.frame(x_train))
forest <- randomForest(Identity ~., data = train_set)
我已将所有数据放在一个数据框中,并在尝试修复错误时添加了 names(counts) <- make.names(names(counts)) 行。
运行此代码时出现错误:
Error in eval(predvars, data, env) : object '0610005C13Rik' not found
我的数据有 16519 列,每列的名称类似于 0610005C13Rik,如果这是问题,我不知道如何重命名所有列。
【问题讨论】:
标签: r regression random-forest