【发布时间】:2014-06-24 01:20:49
【问题描述】:
考虑一个用于电子商务网站的 MySQL products 数据库,其中包含 1000 万种产品。
我正在尝试设置一个分类模块来对产品进行分类。我正在使用 Apache Sqoop 将数据从 MySQL 导入 Hadoop。
我想在它之上使用 Mahout 作为机器学习框架来使用其中一个 Classification algorithms,然后我遇到了由 MLlib 提供的 Spark
- 那么这两个框架有什么区别呢?
- 主要是各有什么优势、不足和局限?
【问题讨论】:
标签: apache-spark mahout apache-spark-mllib