【发布时间】:2014-02-18 16:23:22
【问题描述】:
我有一个 arff 文件,其中包含 700 entries,每个 42000+ features 用于 NLP 相关项目。现在格式是密集格式,但如果使用稀疏表示,条目可以大大减少。
我在core 2 duo machine with 2 GB RAM 上运行,我得到memory out of range eception,尽管将限制增加到1536 MB。
如果我将 arff 文件转换为稀疏表示,或者我需要在功能更强大的机器上运行我的代码,会有什么好处吗?
【问题讨论】:
标签: machine-learning nlp weka information-retrieval arff