【发布时间】:2015-12-21 08:19:51
【问题描述】:
我使用 Google 的 word2vec 训练了一个词嵌入模型。输出是一个包含单词及其向量的文件。
我在 deeplearning4j 中加载了这个经过训练的模型。
WordVectors vec = WordVectorSerializer.loadTxtVectors(new File("vector.txt"));
Collection<String> lst = vec.wordsNearest("someWord", 10);
但是从deeplearing4j的包和word2vec的距离函数得到的两个相似词列表是完全不同的,虽然我使用的是同一个向量文件。
有人对 deeplaring4j 中的工作原理以及这些差异的来源有很好的了解吗?
【问题讨论】:
-
我们支持 Gitter 上的 DL4J 社区:gitter.im/deeplearning4j/deeplearning4j
-
您在训练两个模型时是否使用了相同的参数?
标签: word2vec