【发布时间】:2018-12-12 06:42:52
【问题描述】:
我有多个语言的数据集。 我可以根据其语言应用词形还原吗? 我已经根据其语言分离了数据。 尝试使用 WordNet lemmatization,但它只支持英语
对于多种语言的词干提取,我使用的是 snowballStemmer。
【问题讨论】:
标签: python-3.x nlp data-science lemmatization
我有多个语言的数据集。 我可以根据其语言应用词形还原吗? 我已经根据其语言分离了数据。 尝试使用 WordNet lemmatization,但它只支持英语
对于多种语言的词干提取,我使用的是 snowballStemmer。
【问题讨论】:
标签: python-3.x nlp data-science lemmatization
尝试使用spacy 它支持 34 多种语言,并且具有词形还原器。
【讨论】: