【发布时间】:2015-11-14 09:17:47
【问题描述】:
我使用nltk 3.0.4 并注意到单词boss 和bosses 的引理不同。
from nltk.stem.wordnet import WordNetLemmatizer
wnl = WordNetLemmatizer()
print wnl.lemmatize("boss", "n")
# returns "bos"
print wnl.lemmatize("bosses", "n")
# returns "boss"
从我的角度来看,这是一种奇怪的行为,尤其是 boss 在 WordNet 中是 known word 并且有一个 rule 来保留 ss。
有没有人有解释或者这只是一个错误?我该怎么处理?
【问题讨论】:
标签: python nltk wordnet lemmatization