Sentence2Vec
前言
本文是对论文A Simple but Tough-to-Beat Baseline for Sentence Embeddings中算法的简要描述,具体细节请参考代码实现。
算法介绍
1. 对一个句子中所有词的词向量进行加权平均,每个词向量的权重可以表示为
2. 使用PCA/SVD对向量值进行修改。
算法具体描述如下:
算法输入:
1. 词向量
2. 句子集合
3. 参数
4. 词频
算法输出:
句子
算法细节以及代码实现参考github。