【发布时间】:2013-07-07 12:34:01
【问题描述】:
我有一个如下格式的数据列:
文字
Hello world
Hello
How are you today
I love stackoverflow
blah blah blahdy
我想通过可能使用tau 包的textcnt() 函数来计算此数据集中每一行的3-gram。但是,当我尝试它时,它给了我一个带有整个列的 ngram 的数字向量。如何将此函数分别应用于数据中的每个观察值?
【问题讨论】:
-
@TylerRinker 谢谢泰勒。但是,sapply 没有工作。我这样使用它: > trigram_title
-
最好展示你的所作所为而不是提及它。
-
这篇文章可能对你有帮助...stackoverflow.com/questions/37291984/…
标签: r text text-parsing n-gram tm