【发布时间】:2020-03-30 13:17:29
【问题描述】:
我想找到一个法语单词的所有同义词。我已经实现了使用此代码:
导入 nltk 从 nltk.corpus 导入 wordnet syns=[synset.lemma_names('fra') for synset in wordnet.synsets('maison', lang='fra')] 打印(合成)
程序输出的是上下文相似度而不是语义相似度,也没有输出共轭动词。
有什么想法吗?
谢谢
【问题讨论】:
我想找到一个法语单词的所有同义词。我已经实现了使用此代码:
导入 nltk 从 nltk.corpus 导入 wordnet syns=[synset.lemma_names('fra') for synset in wordnet.synsets('maison', lang='fra')] 打印(合成)
程序输出的是上下文相似度而不是语义相似度,也没有输出共轭动词。
有什么想法吗?
谢谢
【问题讨论】:
基于this post,我建议这个解决方案:
from nltk.tokenize import TreebankWordTokenizer
from nltk.wsd import lesk
from nltk.corpus import wordnet as wn
# ['als', 'arb', 'cat', 'cmn', 'dan', 'eng', 'eus', 'fas',
# 'fin', 'fra', 'fre', 'glg', 'heb', 'ind', 'ita', 'jpn', 'nno',
# 'nob', 'pol', 'por', 'spa', 'tha', 'zsm']
lang='fra'
sent = TreebankWordTokenizer().tokenize("Je voudrai essayer avec cette phrase")
synsets = [lesk(sent, w, 'n') for w in sent]
print(synsets)
for ws in sent:
for ss in [n for synset in wn.synsets(ws, lang=lang) for n in synset.lemma_names(lang)]:
print((ws, ss), '\n')
结果如下:
[无,无,Synset('trier.n.02'),无,无,Synset('phrase.n.04')]
('Je', 'Je')
('Je', 'Moi')
('Je', 'iode')
('Je', 'Je')
('Je', 'Moi')
('essayer', 'essayer')
('essayer', 'essayer')
('essayer', 'rendre')
('essayer', 'tender')
('essayer', 'essayer')
('essayer', 'goût')
('essayer', 'goûter')
('essayer', 'priser')
('essayer', 'tender')
('essayer', '假设者')
('essayer', '企业家')
('essayer', 'essayer')
('essayer', 'tender')
('essayer', 'essayer')
('essayer', 'aspirer')
('essayer', 'chercher')
('essayer', 'essayer')
('essayer', '律师')
('essayer', 'tendre')
('essayer', 'trouver')
('essayer', 'entendre')
('essayer', 'essayer')
('essayer', 'décider')
('essayer', 'essayer')
('essayer', 'juge')
('essayer', 'juger')
('essayer', 'tender')
('essayer', 'chercher')
('essayer', 'efforcer')
('essayer', 'essayer')
('essayer', 'tender')
('essayer', 'essayer')
('essayer', 'tester')
('essayer', '验证者')
('短语', '诅咒者')
('短语', '短语')
('短语', '诅咒')
('短语', '定罪')
('短语', '判断')
('短语', '短语')
('短语', '句子')
('短语', '短语')
('短语', '连接')
('短语', '表达')
('短语', '语言')
('短语', '短语')
('短语', '句法')
('短语', '短语')
('短语', 'théorème')
('短语', '语言')
('短语', '短语')
('短语', '句法')
('短语', '运动')
('短语', '短语')
('短语', 'délai')
('短语', '持续时间')
('短语', 'fois')
('短语', '判断')
('短语', 'longtemps')
('短语', 'peine')
('短语', '短语')
('短语','临时')
【讨论】: