【发布时间】:2018-06-29 00:30:12
【问题描述】:
有人建议,使用词簇初始化主题模型可以产生更高质量的模型或更稳健(一致)的推理。我说的是初始化优化器,而不是设置先验。这是一些代码来说明我想要做什么:
创建一个 LdaModel 对象,但不要传入语料库。
lda_model =
LdaModel(
id2word=id2word,
num_topics=30,
eval_every=10,
pass=40,
iterations=5000)
接下来分配对象的一些属性,对应于将每个单词从主题绘制到我自己构造的矩阵的概率。
lda_model.topics = my_topic_mat
然后拟合语料库:
lda_model.update(corpus)
感谢您的帮助!
【问题讨论】:
-
看来修改正确的可能是lda_model.state.sstats
-
可以在不传递语料库的情况下初始化
LdaModel,稍后调用更新see docs。它不适合你吗? -
是的,可以在不传递语料库的情况下创建对象。我想将主题初始化为某个状态。我正在尝试为此使用 lda_model.state.sstats,但似乎不支持这样做。
标签: python gensim topic-modeling