【发布时间】:2012-07-07 00:08:16
【问题描述】:
我已将数据集存储在 Apache Hive 中,但想对 Hive 数据库中的数据使用 Mahout。
如何集成 Mahout 和 Hive,以便让 Mahout 从 Hive 数据库中读取?
【问题讨论】:
我已将数据集存储在 Apache Hive 中,但想对 Hive 数据库中的数据使用 Mahout。
如何集成 Mahout 和 Hive,以便让 Mahout 从 Hive 数据库中读取?
【问题讨论】:
我认为您需要修改 mahout 作业并替换 hive 中的数据源。当数据存储在 HBase 中时,我会这样做。
【讨论】:
我认为,您可以使用 HiveJDBC driver 并在 Mahout 方面使用相应的 JDBC 组件
【讨论】: