【发布时间】:2019-04-30 15:36:33
【问题描述】:
我正在尝试使用训练数据训练 doc2vec 模型,然后使用训练好的 doc2vec 模型。但是,我无法确定如何执行此操作。
我目前使用model.docvecs.most_similar(...)。但是,此函数仅查找 训练数据 中每个文档与 测试数据 中特定文档的相似度。
我尝试使用model.docvecs.n_similarity(inferred_vector.tolist(), testvectors[i].tolist()) 手动比较测试数据中特定文档的推断向量与测试数据中所有其他文档的推断向量,但这会返回KeyError: "tag '-0.3502606451511383' not seen in training corpus/invalid",因为字典中没有向量。
【问题讨论】:
标签: python machine-learning gensim doc2vec