【问题标题】:Weka classifier does not run for large number of instancesWeka 分类器不适用于大量实例
【发布时间】:2016-02-27 00:02:31
【问题描述】:

我正在使用我的数据来训练 Weka NaiveBayes 分类器。我正在运行交叉验证。当我为 5000 个实例运行它时,它运行得很好,但是当我将实例数增加到 100000 时,它就一直在那里显示:

'基于训练数据构建模型'

没有结果,weka 在几秒钟后停止处理数据。

【问题讨论】:

    标签: weka naivebayes


    【解决方案1】:

    java vm 可能内存不足。增加 RunWeka.ini 中的堆大小来解决这个问题,或者使用更少的数据。您可以在开始训练之前打开并保持打开 CLI 窗口,以便查看错误输出。

    【讨论】:

      【解决方案2】:

      首先,请分享您的代码。您是使用 java api 还是通过 GUI 运行。 JVM 的大小是多少。

      可能的原因是

      资源管理器中显示的文本输出是学习时产生的 所有可用数据的模型。这也是保存的模型 当您将序列化分类器导出到磁盘时。理由是 如果您要将模型投入生产以预测未来的实例 您想使用从所有可用训练数据构建的模型。如果 您对此模型不感兴趣您可以将其关闭(并节省时间) 在“更多选项”对话框中。

      provided here

      【讨论】:

        猜你喜欢
        • 2012-03-25
        • 2012-06-30
        • 2015-02-01
        • 2013-05-13
        • 2011-09-07
        • 2014-05-19
        • 2015-07-02
        • 2019-06-04
        • 2015-07-16
        相关资源
        最近更新 更多