如何在 Apache mahout 中组合两个相似性实例答案

【问题标题】：how to combine two similarity instances in Apache mahout如何在 Apache mahout 中组合两个相似性实例
【发布时间】：2015-04-13 07:46:07
【问题描述】：

我是 Apache mahout 的新手，我有疑问，如果我错了，请纠正我。
假设我们有数据集并从数据集计算推荐，然后将结果显示给用户，当用户再次访问我们的网站时，我们将有新的数据集，因此我们必须再次根据新数据集计算推荐。
我们可以通过合并两个数据集（即旧数据集和新数据集）来做到这一点，但是由于我们已经对旧数据集进行了计算，如果我们将它们结合起来，我们将在旧数据集上再次进行相同的计算，当数据增加时这将成为问题，所以想问有没有其他方法可以做到这一点，我认为的另一种方法是结合两个数据集的相似性，因为推荐基于相似性，但我无法找到任何关于此的内容。

请帮我解决这个问题，

谢谢

【问题讨论】：

标签： hadoop machine-learning mahout recommendation-engine mahout-recommender

【解决方案1】：

您希望根据移动的数据窗口计算建议。决定你的窗口和更新频率。如果您每天更新并且您的窗口是 3 个月，那么您每天都会丢弃最旧天数的数据，并在每次更新时使用最近 3 个月的数据。

【讨论】：

感谢您的回答，但如果我使用窗口，我们的推荐引擎的准确性不会降低，即丢弃旧数据。