【发布时间】:2026-01-22 21:30:01
【问题描述】:
我正在尝试使用预训练模型使用新的标记文档(TaggedDocument)进行训练。
预训练模型是经过训练的模型,其文档的唯一 id 为 label1_index,例如 Good_0、Good_1 到 Good_999 训练数据的总大小约为 7000
现在,我想用具有 label2_index 的唯一 id 的新文档训练预训练模型,例如,Bad_0、Bad_1... 到 Bad_1211 训练数据总大小约为1211
火车本身是成功的,没有任何错误,但问题是,每当我尝试使用“most_similar”时,它只会建议标有 Good_ 的类似文档...我希望标有 Bad_。
如果我从一开始就完全训练,它会给出我期望的答案——它会推断出一个新给定的文档,类似于标记为“好”或“坏”的文档。
但是,上面的练习不会像从一开始就完全训练的那样起作用。
是继续火车无法正常工作还是我犯了一些错误?
【问题讨论】:
标签: gensim doc2vec pre-trained-model resuming-training