【发布时间】:2016-08-12 09:20:57
【问题描述】:
我仍在使用 Spark 1.6 并训练了一个 StandardScalar,我希望将其保存并在未来的数据集上重复使用。
使用the supplied examples 我可以成功转换数据,但我找不到保存训练有素的归一化器的方法。
有什么方法可以保存经过训练的归一化器吗?
【问题讨论】:
-
那是因为它不是模型。它只是标准化的数据,因此您实际上只需按原样保存数据即可。
-
谢谢以利亚。我不确定我是否同意,规范化器应该包含一系列能够实现标准化转换的方法和标准偏差。所以基本上我正在寻找一种方法来解决这些问题并应用于新的数据集。 ml(而不是 mlib)包具有保存功能。
标签: scala apache-spark