【问题标题】:R - LDA Topic Model Output DataR - LDA 主题模型输出数据
【发布时间】:2014-07-16 20:51:52
【问题描述】:

我正在使用“topicmodels”包在 R 中构建一些主题模型。在预处理和创建文档术语矩阵之后,我正在应用以下 LDA Gibbs 模型。这可能是一个简单的答案,但我是 R 的新手,所以就这样吧。有没有办法可以将主题和术语列表及其概率导出到文本文件或 Excel 文件?我可以在 R 中打印它们(如下所示),但不知道如何导出 :(

这主要是为了我可以做一些可视化,我确信可以在 Excel 中完成,但是就像我提到的那样,我是一个新手,没有太多的东西可以学习 R 中的可视化技术。希望这个有道理

k = 33
burnin = 1000
iter = 1000
keep = 50
seed = 2003


model_lda <- LDA(myDtm, k = k, method = "Gibbs",control = list(seed = seed, burnin =     burnin, iter = iter, keep = keep))
print(model_lda)
save(model_lda, file = "LDA_Output.RData")

topics(model_lda, 5)
terms(model_lda, 15)


 Topic 1   Topic 2    Topic 3       Topic 4   Topic 5    Topic 6    Topic 7 
[1,] "seat"    "dialogu"  "websit"      "census"  "northern" "growth"   "hse"   
[2,] "resum"   "church"   "partnership" "disabl"  "univers"  "adjust"   "legisl"
[3,] "suspend" "congreg"  "nesc"        "cso"     "peac"     "forecast" "die"   
[4,] "adjourn" "school"   "site"        "statist" "unemploy" "bernard"  "legal" 
[5,] "fisheri" "survivor" "nesf"        "survey"  "polic"    "burton"   "child" 

【问题讨论】:

  • 通常使用write.table 从 R 导出数据。如果您只有简单的向量,cat 也很有用。也许您可以更明确地说明您需要的输出格式。

标签: r lda topic-modeling


【解决方案1】:

首先,您可以使用readr 读取数据,然后您可以使用tidytext R 包。例如:

readr::write_csv(tidy(model_lda, "beta"), "beta.csv")

readr::write_csv(tidy(model_lda, "gamma"), "gamma.csv")

上述代码应将您的beta 矩阵和gamma 矩阵分别保存在beta.csvgamma.csv 中。

您还可以在这里找到对我有帮助的章节:http://tidytextmining.com/topicmodeling.html

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-03-25
    • 1970-01-01
    • 2021-05-12
    • 1970-01-01
    • 2018-10-21
    • 2020-03-30
    相关资源
    最近更新 更多