【发布时间】:2021-06-26 01:27:44
【问题描述】:
Gensim Word2Vec 模型有一个很棒的方法,它允许您在给定正面词和负面词列表的情况下找到模型词汇表中前 n 个最相似的词。
wv.most_similar(positive=['word1', 'word2', 'word3'],
negative=['word4','word5'], topn=10)
我要做的是创建表示输入正负词的平均或求和向量的词向量。我希望使用这个新向量与其他向量进行比较。 像这样的:
newVector = 'word1' + 'word2' + 'word3' - 'word4' - 'word5'
我知道向量可以相加,但我不确定这是否是最佳选择。我希望确切地找出上述函数(most_similar)如何结合正向量和负向量,以及 Gensim 是否有这样做的函数。提前谢谢你。
【问题讨论】:
标签: nlp gensim word2vec word-embedding