【发布时间】:2019-11-12 10:38:53
【问题描述】:
我正在尝试使用 gensim 训练 Doc2Vec 模型。
我使用的数据集是 20 个新闻组数据集 [1],它包含在 sklearn 的数据集模块中。
我已使用 gensim 文档中的示例来创建模型。
docs = newsgroups_train['data']
enumerated_docs = enumerate(docs)
documnets= [TaggedDocument(doc.split(),i) for i, doc in enumerated_docs]
model = Doc2Vec(documnets, vector_size=20, window=2, min_count=30, workers=4)
我检查了每一行代码,似乎都在初始化模型的那一行。
我收到一个类型错误:
TypeError: 'int' object is not iterable
[1]https://scikit-learn.org/0.19/datasets/twenty_newsgroups.html
【问题讨论】: