【发布时间】:2017-12-24 23:56:10
【问题描述】:
我正在尝试从 gensim 包中运行 doc2vec 库。我的问题是,当我训练和保存模型时,模型文件相当大(2.5 GB)我尝试使用这一行:
model.estimate_memory()
但这并没有改变任何东西。我还尝试更改 max_vocab_size 以减少空间。但是没有运气。有人可以帮我解决这个问题吗?
【问题讨论】:
-
这里没有错,文档嵌入非常庞大。
-
我投票决定将此问题作为题外话结束,因为这不是一个可以解决的问题,只是对所使用的库的工作方式的误解。 2.5G 在这方面已经是小众了。
-
我不反对。有人不了解编程任务的资源需求,从而产生问题。解释算法/库的底层操作可以解决误解,还有其他编码选项可以实现底层目标。这些构成了对充分指定的问题的有用答案。
标签: python semantics gensim word2vec doc2vec