【发布时间】:2021-10-10 18:42:28
【问题描述】:
我对 Word2Vec 变换过程的理解是,在使用大量句子语料库训练模型后,模型将学习向量空间,我们可以使用词向量来变换 k的句子> 单词到长度为 D 的单个向量,其中 D 是维数。 k 个单词将被转换为一个 k * V one-hot 编码矩阵,其中 V 是词汇表的大小。然后计算输入隐藏权重 (V * D)。结果是一个 k * V 矩阵。如果我们对列中的k个元素进行平均,我们可以得到长度为D的最终向量。
我的问题是,直观地说,长度为 D 的最终向量到底意味着什么。当您对 k 行进行平均时,是否会删除某些内容?此外,诸如“婴儿喜欢胡萝卜”之类的句子。和“carrots love baby”会转化成同一个向量,但是两个句子完全不同。
【问题讨论】:
标签: word2vec