【发布时间】:2023-03-25 13:45:01
【问题描述】:
例如,假设给定单词“happy”,我想生成其他形式的happy,例如happy、happy...等。
我已经阅读了有关 Stackoverflow 和 NLTK 参考的其他一些先前问题。但是,只有词性标注,变形就像识别句子中某些单词的语法形式,而不是生成不同单词的列表。有没有人遇到过类似的问题?谢谢。
【问题讨论】:
-
这与词干提取相反。在您的情况下,您可以将词干应用于大型语料库,跟踪哪些词被词干为相同的形式——例如,使用兰开斯特词干分析器,“快乐”、“快乐”和“快乐”都映射到“快乐” ”。然后将这些集群用于生成任务。
标签: python python-2.7 nlp nltk wordnet