【发布时间】:2019-08-20 21:54:09
【问题描述】:
我正在尝试进行一些文本分析,我想知道是否有任何工具或包可以识别不同形式的英语单词(例如单数、复数、过去、现在等)并获得字数。
在这个字符串向量 myvec <- c("fired", "fires", "firing", "fired", "hospitals", "Hospitals", "hospital", "hospitalization", "Hospitalized") 中,我想获取单词 Fire = 4 和单词 Hospital = 5 的计数。
【问题讨论】:
-
@r2evans 那会给
fired fires firing hospital hospitals Hospitals 2 1 1 1 1 1 -
MAPK,我删除了它,显然不够快:-)。你试过
NLP包吗?如果包本身不足,它的 revdeps 可能会为它的进一步发展提供线索。
标签: r