【发布时间】:2023-04-19 13:27:01
【问题描述】:
我尝试构建一个相当于 Char-RNN 的 Word-RNN,网络应该生成句子中的下一个单词。
我使用预训练的 word2vec 100-dim 向量作为输入,隐藏层大小为 200。我的主要问题是输出层,应该如何设计?
在 char-rnn 中,输出是词汇量大小(唯一字符数)向量和字符概率分布(softmax)。所以生成下一个字符只是从这个分布中抽样。 但是当我的单词词汇量超过 300k 时使用 word2vec 这种方法是不可行的。
如果我的输出生成 100 维向量,然后我应该使用 gensim similar_by_vector function 找到最近的相似词
您能否提供一些好的且易于理解的 python 和 tensorflow 实现,一些指向 github 或出版物的链接。
我找到了similar question,但它没有回答我的问题:
【问题讨论】:
标签: python tensorflow neural-network recurrent-neural-network word2vec