【发布时间】:2018-06-18 07:07:53
【问题描述】:
我有一个包含不同年份的文档的数据集,我的目标是为每一年的数据训练一个嵌入模型,同时,不同年份出现的同一个词将具有相似的向量表示。像这样:对于单词“compute”,它在第 1 年的向量是
[0.22, 0.33, 0.20]
在第 2 年,情况有所不同:
[0.20, 0.35, 0.18]
有没有办法做到这一点?例如,使用初始值(如果单词在第 1 年已经训练过,修改其向量)和随机性(如果这是语料库的新词)训练第 2 年的模型。
【问题讨论】:
标签: machine-learning nlp word2vec gensim word-embedding