【发布时间】:2025-11-23 11:15:01
【问题描述】:
我已经训练了大约 2300 个段落的段落向量(每个段落在 2000-12000 个单词之间),每个段落的向量大小为 300。现在,我需要推断出我认为是段落的大约 100,000 个句子的段落向量(每个句子大约10-30 个单词,每个单词对应前面已经训练的 2300 段)。
所以,我正在使用
model.infer_vector(sentence)
但是,问题是它花费的时间太长,而且它没有任何参数,例如“workers”。!有没有办法可以通过线程或其他方式加快进程?我正在使用一台 8gb 内存的机器,当我检查可用内核时使用
cores = multiprocessing.cpu_count()
结果是 8。
我需要这个来回答多项选择题。另外,是否有任何其他库/模型(例如 doc2vec)可以帮助完成这项任务?
提前感谢您的宝贵时间。
【问题讨论】:
标签: python gensim word2vec doc2vec