【问题标题】:Text mining using SpaCyr, What can be done?使用 SpaCyr 进行文本挖掘,可以做什么?
【发布时间】:2021-01-20 10:18:32
【问题描述】:

最近,我构建了一个模型,该模型可以使用 SpaCy 依赖解析、基于规则的匹配器和 nlp.pipe() 来检测数据集记录中的被动语态。为了更清楚,这里是the code for the project

现在,我的问题是,有什么方法可以使用 Spacy 匹配器在 R 中使用 SpaCyr 执行此任务?我自己找不到任何具体的东西,但我认为可能有一些方法可以让我自己构建具有类似功能的东西。

我也可以在 python 的 nlp.pipe() 中使用 n_processes 参数,因为我正在使用的数据集非常大。因此,如果有人对此也有任何想法,我也很想听听!

提前致谢!

【问题讨论】:

    标签: python r nlp spacy text-mining


    【解决方案1】:

    您可以将您的“被动规则”转换为基于 R 包 rsyntax https://cran.r-project.org/web/packages/rsyntax/index.html (https://github.com/vanatteveldt/rsyntax) 的逻辑 - 逻辑显示在 https://github.com/vanatteveldt/rsyntax/blob/master/Querying_dependency_trees.pdf 它允许使用 udpipe 或 spacyr 解析器的输出来构造带注释文本的查询。

    【讨论】:

    • 非常感谢您的参考!我浏览了 pdf,但实际上找不到任何使我能够在文本中拥有一个可选依赖项或关系的内容。你认为这样的事情可以在 R 中使用查询来实现吗?
    • 是的,看看 rsyntax 的文档,而不仅仅是 pdf
    猜你喜欢
    • 2015-08-04
    • 2013-11-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-02-16
    • 2013-03-26
    • 1970-01-01
    相关资源
    最近更新 更多