【发布时间】:2018-06-23 02:49:34
【问题描述】:
在 ubuntu 上运行 gensim Doc2Vec
Doc2Vec 拒绝我的输入并出现错误
AttributeError: 'list' 对象没有属性 'words'
import gensim from gensim.models
import doc2vec as dtv
from nltk.corpus import brown
documents = brown.tagged_sents()
d2vmodel = > dtv.Doc2Vec(documents, size=100, window=1, min_count=1, workers=1)
我已经尝试过 this SO question 以及许多具有相同结果的变体
文档 = [brown.tagged_sents()} 添加哈希函数
如果语料库是一个 .txt 文件,我可以使用
documents=TaggedLineDocument(documents)
但这通常是不可能的
【问题讨论】: