使用 RapidMiner 从多个文件中训练模型答案

【问题标题】：Using RapidMiner to train a model from multiple files使用 RapidMiner 从多个文件中训练模型
【发布时间】：2015-01-05 01:23:35
【问题描述】：

我正在做一些项目，需要使用数据文件训练我的模型。问题是用于模型训练的数据文件大小为 10 gigs。所以，我无法一次导入数据。另一种方法是修剪数据并仅使用 5% 的训练数据。但我可能会丢失一些信息。我的问题是“是否可以通过将文件拆分为多个文件来训练模型？”

【问题讨论】：

也许你应该在 rapidminer 论坛 上发布这个问题，而不是在 programming 网站上。因为它是关于使用程序 rapidminer，而不是关于编程。

【解决方案1】：

可以使用Update Model 运算符来使用新的示例集数据更新先前创建的模型。并非所有模型运算符都可以这样使用，朴素贝叶斯和 k-NN 确实可以像 Weka 的 W-IBk 一样工作。

可以在 RapidMiner 中创建一个流程，将文件拆分成更小的部分，逐一读取并从中创建模型。

【讨论】：