【发布时间】:2014-07-24 02:46:33
【问题描述】:
来自 NLTK WordNet API:
>>> from nltk.corpus import wordnet as wn
>>> for i in wn.synsets('discover'):
... print i, i.offset
...
Synset('detect.v.01') 2154508
Synset('learn.v.02') 598954
Synset('discover.v.03') 1637982
Synset('discover.v.04') 721437
Synset('fall_upon.v.01') 2286687
Synset('unwrap.v.02') 933821
Synset('discover.v.07') 2128066
Synset('identify.v.05') 652346
>>> wn.synset('discover.v.8')
Synset('identify.v.05')
从 WN3.0 的 index.verb 文件中,我们有:
discover v 8 6 @ ~ * > $ + 8 7 02154508 00598954 01637982 00721437 02286687 00933821 02128066 00652346
我已经检查了 WordNet API (http://www.nltk.org/_modules/nltk/corpus/reader/wordnet.html),但没有太多要说明如何从 discover.v.8 映射到 identify.v.5。
谁能解释映射是如何发生的?
如何提取这些映射的列表?
【问题讨论】:
-
喜欢从 discover.v.8 到 identify.v.5 的确切路径?
-
是的,但是如何提取这些同义词的列表?