【发布时间】:2021-05-01 16:12:04
【问题描述】:
在 R 中执行 cnlp_download_corenlp() 命令时,出现以下错误。 py_module_import(module, convert = convert) 中的错误:ModuleNotFoundError: No module named 'stanfordnlp'
【问题讨论】:
标签: r stanford-nlp
在 R 中执行 cnlp_download_corenlp() 命令时,出现以下错误。 py_module_import(module, convert = convert) 中的错误:ModuleNotFoundError: No module named 'stanfordnlp'
【问题讨论】:
标签: r stanford-nlp
来自cleanNLPdocumentation:
目前有四种可用的后端,每种都有各自的优缺点。它们是:
stringi:只需要 stringi 包的快速解析器,但只生成标记化的文本
udpipe:一个没有外部依赖关系的解析器,它产生标记、引理、词性标签和依赖关系。推荐的起点是在易用性和功能之间取得平衡。它还支持最广泛的自然语言。
spacy:基于 Python 库,一个功能更完整的解析器,包括命名实体识别和词嵌入。它确实需要一个有效的 Python 安装和一些其他设置。推荐给熟悉 Python 或计划大量使用该包的用户。
corenlp:另一个 Python 库(以前称为 Java),它是同名 Java 库的官方端口。
如果您没有安装corenlp Python 库,您可以尝试切换到stringi 或udpipe:
library(stringi)
cnlp_init_stringi(locale="en_GB")
或者
library(udpipe)
cnlp_init_udpipe(model_name="english")
【讨论】: