【发布时间】:2017-05-08 19:59:55
【问题描述】:
我正在使用 quanteda 包来生成词频计数的稀疏矩阵。我想进行更改,以便输出是 bonary,所以简单地 1 或 0,是否存在这个词,但我不确定如何使用稀疏矩阵来做到这一点。
install.packages(quanteda)
示例矩阵
trainingset <- as.dfm(matrix(c(1, 2, 0, 0, 0, 0,
0, 2, 0, 0, 1, 0,
0, 1, 0, 1, 0, 0,
0, 1, 1, 0, 0, 1,
0, 3, 1, 0, 0, 1),
ncol=6, nrow=5, byrow=TRUE,
dimnames = list(docs = paste("d", 1:5, sep = ""),
features = c("Beijing", "Chinese", "Japan", "Macao",
"Shanghai", "Tokyo"))))
【问题讨论】:
标签: r sparse-matrix