【发布时间】:2018-01-05 16:20:28
【问题描述】:
我有一个奇怪的错误,仅在我的同事 RStudio 运行代码时才会发生。代码是处理文本语料库,这就是我所做的:
ap.corpus <- corpus(raw.data$text)
ap.corpus
#Corpus consisting of 214,226 documents and 0 docvars.
ap.corpus <- Corpus(VectorSource(ap.corpus))
ap.corpus <- tm_map(ap.corpus,tolower)
ap.corpus<-corpus(ap.corpus)
最后一步是在我进入模型之前重新格式化。我顺利运行此代码,没有任何问题。 另一方面,我的同事尝试在完全相同的数据上运行完全相同的代码,并在 ap.corpus
我们尝试重新启动 R studio,尝试在较小的语料库(只有 500 个文档)上运行,仍然出现同样的错误。 希望其他人遇到类似的错误。这似乎不是代码问题,因为我从未在我的 RStudio 中运行此代码或类似代码时遇到过此类错误。 注意:我的同事也在 R 中运行代码,避免使用 RStudio。同样的问题。
【问题讨论】:
-
你有没有在每台机器上运行
sessionInfo(),看看你和你同事的包版本是否有差异?另外,你能在你同事的机器上用 5 个文件重现错误吗?如果是这样,您能否使用dput()并发布 5 个文档的数据,以便您的问题可以重现? -
感谢 Len 的建议。我会照办的。不幸的是,我今天无法尝试,因为另一台计算机在印度,但是一旦我们再次连接,我将首先对其进行测试。