【发布时间】:2017-03-25 17:15:18
【问题描述】:
我有一个句子列表,我按照tutorial 的说明从中制作语料库:
texts = [[word for word in document.lower().split() if word.isalpha()] for document in documents]
corpus = corpora.Dictionary(texts)
我想在这个语料库上训练一个 LDA 模型并提取主题关键字。
lda = models.LdaModel(corpus, num_topics=10)
但是,我在训练时收到错误消息:TypeError: 'int' object is not iterable。我究竟做错了什么?语料库的格式应该是什么?
【问题讨论】: