【问题标题】:Using RapidMiner to train a model from multiple files使用 RapidMiner 从多个文件中训练模型
【发布时间】:2015-01-05 01:23:35
【问题描述】:

我正在做一些项目,需要使用数据文件训练我的模型。问题是用于模型训练的数据文件大小为 10 gigs。所以,我无法一次导入数据。 另一种方法是修剪数据并仅使用 5% 的训练数据。但我可能会丢失一些信息。 我的问题是“是否可以通过将文件拆分为多个文件来训练模型?”

【问题讨论】:

  • 也许你应该在 rapidminer 论坛 上发布这个问题,而不是在 programming 网站上。因为它是关于使用程序 rapidminer,而不是关于编程。

标签: machine-learning classification linear-regression rapidminer


【解决方案1】:

可以使用Update Model 运算符来使用新的示例集数据更新先前创建的模型。并非所有模型运​​算符都可以这样使用,朴素贝叶斯和 k-NN 确实可以像 Weka 的 W-IBk 一样工作。

可以在 RapidMiner 中创建一个流程,将文件拆分成更小的部分,逐一读取并从中创建模型。

【讨论】:

    猜你喜欢
    • 2018-07-31
    • 2017-08-19
    • 1970-01-01
    • 1970-01-01
    • 2015-06-17
    • 1970-01-01
    • 2019-06-23
    • 2018-04-02
    • 2018-10-23
    相关资源
    最近更新 更多