【发布时间】:2015-08-11 16:09:34
【问题描述】:
在 Gensim 的 Doc2Vec 中,如何结合句子向量来为段落制作单个向量?我知道你可以训练整个段落,但显然训练单个句子、上下文等会更好。(我认为......?)
有什么建议或正常用例吗?
另外,我如何从模型中检索句子/段落向量?
【问题讨论】:
在 Gensim 的 Doc2Vec 中,如何结合句子向量来为段落制作单个向量?我知道你可以训练整个段落,但显然训练单个句子、上下文等会更好。(我认为......?)
有什么建议或正常用例吗?
另外,我如何从模型中检索句子/段落向量?
【问题讨论】:
Doc2Vec 的架构本身不涉及任何解析,因此对整个段落进行训练/测试是有意义的。
在原始paper 中,作者展示了仅将整个段落视为一个句子的结果,优于现有技术。
【讨论】: