【发布时间】:2016-01-26 19:29:03
【问题描述】:
我使用 tm 包从我的语料库创建了一个文档术语矩阵。
dtm <- DocumentTermMatrix(myCorpus, control=list(wordLengths=c(4, 20),
bounds = list(global = c(1,13))))
然后我创建了一个术语-术语邻接矩阵。
ttm_results <- t(as.matrix(dtm)) %*% as.matrix(dtm)
当我检查我的结果样本时
ttm_results[200:205, 200:205]
我注意到这是一个非常大但稀疏的数据集。
如何删除essentially zeros 的行?
我认为essentially zero 包含没有adjacent 术语的行,例如 1,2 和 5。
【问题讨论】: