【发布时间】:2016-02-27 00:02:31
【问题描述】:
我正在使用我的数据来训练 Weka NaiveBayes 分类器。我正在运行交叉验证。当我为 5000 个实例运行它时,它运行得很好,但是当我将实例数增加到 100000 时,它就一直在那里显示:
'基于训练数据构建模型'
没有结果,weka 在几秒钟后停止处理数据。
【问题讨论】:
标签: weka naivebayes
我正在使用我的数据来训练 Weka NaiveBayes 分类器。我正在运行交叉验证。当我为 5000 个实例运行它时,它运行得很好,但是当我将实例数增加到 100000 时,它就一直在那里显示:
'基于训练数据构建模型'
没有结果,weka 在几秒钟后停止处理数据。
【问题讨论】:
标签: weka naivebayes
java vm 可能内存不足。增加 RunWeka.ini 中的堆大小来解决这个问题,或者使用更少的数据。您可以在开始训练之前打开并保持打开 CLI 窗口,以便查看错误输出。
【讨论】:
首先,请分享您的代码。您是使用 java api 还是通过 GUI 运行。 JVM 的大小是多少。
可能的原因是
资源管理器中显示的文本输出是学习时产生的 所有可用数据的模型。这也是保存的模型 当您将序列化分类器导出到磁盘时。理由是 如果您要将模型投入生产以预测未来的实例 您想使用从所有可用训练数据构建的模型。如果 您对此模型不感兴趣您可以将其关闭(并节省时间) 在“更多选项”对话框中。
【讨论】: