【发布时间】:2015-08-31 07:36:02
【问题描述】:
我应该使用 MyMediaLite 制作图书推荐服务。到目前为止,我已经使用 Nutch 爬虫从网站收集书籍并将信息存储到 hbase 中。问题是我实际上并不完全理解,这一切是如何运作的。例如,我必须通过测试数据和训练数据文件,以及用户-项目 ID 对和评级。但是书籍的其他信息,如类别和作者呢?在没有用户信息的情况下(到目前为止),如何通过信息等找到“相似”的书籍?是否可以直接从 hbase 传递数据,而不将其存储到文件然后导入? 或者这个工作更适合 Apache Mahout 或 LibRec?
【问题讨论】:
标签: service recommendation-engine collaborative-filtering