【问题标题】:Can word2vec model be used for words also as training data instead of sentencesword2vec 模型可以用于单词也可以作为训练数据而不是句子
【发布时间】:2019-09-18 16:36:34
【问题描述】:

在 Word2vec 中我们可以使用单词而不是句子来进行模型训练

像下面的代码 gberg_sents 是句子标记 model = Word2Vec(sentences=gberg_sents,size=64,sg=1,window=10,min_count=5,seed=42,workers=8)

这样我们也可以使用单词标记

【问题讨论】:

  • 不清楚你的意思。 sentences 参数只需要是一个(重新)可迭代的序列,其中每个项目都是一个单词列表。 (这就是您的示例中的gberg_sents 吗?展示它是如何创建的或一些示例项目。)

标签: word2vec natural-language-processing


【解决方案1】:

不,word2vec 是使用语言建模目标进行训练的,即它预测出现在其他单词周围的单词。为此,您的训练数据需要是显示单词在上下文中如何使用的实际句子。实际上,单词的上下文为您提供了嵌入中捕获的信息。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-07-08
    • 1970-01-01
    • 2016-05-09
    • 2016-09-16
    • 1970-01-01
    相关资源
    最近更新 更多