【问题标题】:how to combine two similarity instances in Apache mahout如何在 Apache mahout 中组合两个相似性实例
【发布时间】:2015-04-13 07:46:07
【问题描述】:



我是 Apache mahout 的新手,我有疑问,如果我错了,请纠正我。
假设我们有数据集并从数据集计算推荐,然后将结果显示给用户,当用户再次访问我们的网站时,我们将有新的数据集,因此我们必须再次根据新数据集计算推荐。
我们可以通过合并两个数据集(即旧数据集和新数据集)来做到这一点,但是由于我们已经对旧数据集进行了计算,如果我们将它们结合起来,我们将在旧数据集上再次进行相同的计算,当数据增加时这将成为问题,所以想问有没有其他方法可以做到这一点,我认为的另一种方法是结合两个数据集的相似性,因为推荐基于相似性,但我无法找到任何关于此的内容。

请帮我解决这个问题,

谢谢

【问题讨论】:

    标签: hadoop machine-learning mahout recommendation-engine mahout-recommender


    【解决方案1】:

    您希望根据移动的数据窗口计算建议。决定你的窗口和更新频率。如果您每天更新并且您的窗口是 3 个月,那么您每天都会丢弃最旧天数的数据,并在每次更新时使用最近 3 个月的数据。

    【讨论】:

    • 感谢您的回答,但如果我使用窗口,我们的推荐引擎的准确性不会降低,即丢弃旧数据。
    猜你喜欢
    • 1970-01-01
    • 2014-12-30
    • 2023-03-25
    • 2012-06-11
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-08-04
    • 1970-01-01
    相关资源
    最近更新 更多