【发布时间】:2012-03-25 00:14:45
【问题描述】:
我已经研究了几个星期的LDA和Topic模型。但是由于我的数学能力较差,我不能完全理解它的内部算法。我使用了GibbsLDA实现,输入了很多文档,并将主题编号设置为100 ,我得到一个名为“final.theta”的文件,其中存储了每个文档中每个主题的主题比例。这个结果很好,我可以使用主题比例做很多其他事情。 但是当我在 LDA 上尝试 Blei 的 C 语言实现时,我只得到一个名为 final.gamma 的文件,但我不知道如何将这个文件转换为主题比例样式。 谁能帮我。 而且我了解到LDA模型有很多改进版本(例如CTM,HLDA),如果我能找到一个类似于LDA的主题模型,我的意思是当我输入很多文档时,它可以直接输出文档中的主题比例. 非常感谢!
【问题讨论】:
-
+1 用于 LDA 参考 - 这对我来说是一个新想法。谢谢。
标签: algorithm model lda dirichlet