【发布时间】:2016-12-14 14:52:16
【问题描述】:
我注意到 SparkML 中有两个 LinearRegressionModel 类,一个在 ML 包 (spark.ml) 中,另一个在 MLLib (spark.mllib) 包中。
这两者的实现方式完全不同 - 例如来自MLLib 的那个实现了Serializable,而另一个没有。
顺便说一句,RandomForestModel 或 Word2Vec 也是如此。
为什么有两个类?哪个是“正确的”?有没有办法将一个转换成另一个?
【问题讨论】:
标签: apache-spark apache-spark-mllib apache-spark-ml