【问题标题】:Visualize a Word2Vec model using Embedding Projector使用 Embedding Projector 可视化 Word2Vec 模型
【发布时间】:2018-04-26 08:32:17
【问题描述】:
使用 TensorFlow 的嵌入投影仪可视化 Word2Vec 模型的最佳方法是什么?
有没有办法将 Word2Vec 模型的向量导出为 Embedding Projector 期望的格式?或者 tensorflow 中有内置函数吗?
谢谢!
【问题讨论】:
-
你可以看看this。似乎人们为此编写了一个脚本。不过我没试过
-
标签:
tensorflow
nlp
data-visualization
word2vec
gensim
【解决方案1】:
使用保存您的模型
model = Word2Vec(sentences)
model.wv.save_word2vec_format('model_name')
然后将模型转换为Embedding Projector所需的输入文件:
python -m gensim.scripts.word2vec2tensor --input model_name --output model_name
这将生成:model_name_tensor.tsv 和 model_name_metadata.tsv
最后一个脚本是在 PR 中引入的,来自您原始问题的评论中链接的问题。