【问题标题】:Data Model for Generating recommendations using Apache Mahout使用 Apache Mahout 生成推荐的数据模型
【发布时间】:2013-07-13 03:18:17
【问题描述】:

我计划为我的 Web 应用程序的用户生成推荐。所以我决定使用 Apache Mahout。我见过的大多数教程都使用 FileDataModel(其中数据存储在 csv 文件中)但是我的数据在数据库中。

对于大约有 500 到 1000 个用户的 Web 应用程序,使用 FileDataModel 生成用户推荐是否足够好?(我只需将所需的数据从数据库传输到我的 CSV 文件)?或者有其他选择吗?

这里是我提到的firstsecond 教程。

【问题讨论】:

    标签: java jakarta-ee hadoop mahout recommendation-engine


    【解决方案1】:

    可以使用 JDBCDataModel 从数据库中访问偏好数据。

    看看MySQLJDBCDataModel

    【讨论】:

    • 同意,这是正确的答案。在任何规模下,直接从数据库中读取都太慢了。最后,数据必须在内存中。为此,请参阅重新加载 JDBCDataModel。
    • @SeanOwen 如果我有 100 到 1000 个用户在使用我的应用程序,这仍然可靠吗?假设有 100 个并发用户访问我的网站
    • 您不能每次想要为用户推荐推荐时都运行推荐器。您必须使用推荐服务,该服务会定期学习使用新数据,并且您的网络服务应该特别要求用户推荐
    【解决方案2】:

    Mahout 还为许多其他数据源提供 DBDataModel,包括 MongoDBDataModel,以及几乎任何符合 JDBC 的数据源。平面文件数据模型也适用于较小的数据集

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2017-08-08
      • 2017-08-17
      • 2014-04-18
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多