【问题标题】:Multi language Lemmatization in PythonPython中的多语言词形还原
【发布时间】:2018-12-12 06:42:52
【问题描述】:

我有多个语言的数据集。 我可以根据其语言应用词形还原吗? 我已经根据其语言分离了数据。 尝试使用 WordNet lemmatization,但它只支持英语

对于多种语言的词干提取,我使用的是 snowballStemmer。

【问题讨论】:

    标签: python-3.x nlp data-science lemmatization


    【解决方案1】:

    尝试使用spacy 它支持 34 多种语言,并且具有词形还原器。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2014-04-04
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-08-01
      相关资源
      最近更新 更多