【发布时间】:2014-12-09 14:21:48
【问题描述】:
我的目标:我正在尝试识别 推文中的位置(如果存在)。
我尝试使用 Opennlp 包并多次遇到“内存不足错误”,尽管增加了堆内存大小。 代码在识别 6-8 条推文的位置后终止。
我只对 100-150 个位置(范围列表) 感兴趣,但是将推文中的每个单词与推文集合的列表进行匹配是非常低效的。
我想知道除了“NLP”之外,是否有任何合适的包可以使用 R 为 Twitter 数据启用 NER ?
另外,执行此例程的最有效方法是什么?
我对 python/Java不是很熟悉,因此想使用 R。
谢谢。
【问题讨论】: