【问题标题】:Understanding usage of glove vectors了解手套矢量的用法
【发布时间】:2020-02-04 10:54:13
【问题描述】:

我使用以下代码将手套向量用于词嵌入

from gensim.scripts.glove2word2vec import glove2word2vec    #line1
glove_input_file = 'glove.840B.300d.txt'  #line2
word2vec_output_file = 'glove.word2vec'   #line3
glove2word2vec(glove_input_file, word2vec_output_file)  #line4
from gensim.models import KeyedVectors  #line5
glove_w2vec = KeyedVectors.load_word2vec_format('glove.word2vec', binary=False) #line6

我知道这段代码用于使用 glove 预训练向量进行词嵌入。但我不确定每一行发生了什么。为什么要将手套转换为 word2vec 格式? KeyedVectors.load_word2vec_format 到底是做什么的?

【问题讨论】:

    标签: python nlp word2vec word-embedding glove


    【解决方案1】:

    GloVe 算法和word2vec 都创建词向量,每个词一个向量。

    但存储这些向量的格式略有不同。 gensimglove2word2vec() 函数可让您将 GloVe 格式的文件转换为原始 Google word2vec.c 代码使用的格式。

    https://radimrehurek.com/gensim/scripts/glove2word2vec.html

    同时,gensimKeyedVectors.load_word2vec_format() 方法可以将word2vec.c 格式的向量加载到KeyedVectors(或其同一接口子类之一)的实例中,以便于查找和其他常见的词向量操作。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-08-11
      • 1970-01-01
      • 2015-07-30
      • 1970-01-01
      相关资源
      最近更新 更多