【发布时间】:2018-11-24 10:01:58
【问题描述】:
我正在使用 Google 的 Word2vec,我想知道在给定输入词的情况下,如何获得使用分层 softmax 训练的 skipgram 模型预测的热门词?
例如,当使用负采样时,可以简单地将输入词的嵌入(来自输入矩阵)与输出矩阵中的每个向量相乘,然后取最高值的那个。然而,在分层 softmax 中,由于使用了 Huffman 树,因此每个输入单词都有多个输出向量对应。
在这种情况下,我们如何计算给定输入词的输出词的似然值/概率?
【问题讨论】:
标签: python c++ nlp word2vec gensim