【问题标题】:Combine search engine and machine learning [closed]结合搜索引擎和机器学习[关闭]
【发布时间】:2016-12-22 10:33:40
【问题描述】:

我是搜索引擎的新手,也是机器学习的新手。但我想知道是否有一种方法可以将 elasticsearch 或 Apache Solr 等搜索引擎的功能与 Apache Mahout、H2O 或 PredictionIO 等机器学习项目的功能结合起来。

例如,如果您在可以搜索目的地的旅游网站上工作。你开始输入“au”,所以第一个建议是“AUstria”、“AUstralia”、“mAUrice island”、“mAUrit​​ania”……等等……这通常是 elasticsearch 可以做的。

但是您知道该用户已经在毛里塔尼亚旅行了 3 次,因此您希望毛里塔尼亚在建议的首位。我猜这通常是机器学习可以做到的。

这两种技术之间是否存在桥梁?机器学习能否保证搜索引擎高效工作?

无论使用何种技术,我都愿意接受所有答案。如果您曾经遇到过此类问题,我会大开眼界:-)

谢谢

【问题讨论】:

  • 我认为这是一个有趣的话题,因为太宽泛而被关闭。也许您可以删除它并尝试一个新问题,该问题只关注您要解决的问题。例如。鉴于我们知道有关用户的上下文信息,如何增强弹性搜索?或者从技术入手:如何利用 H2O 对搜索引擎返回的搜索建议进行智能排序。

标签: search machine-learning mahout h2o predictionio


【解决方案1】:

您的问题本质上非常笼统-因此我的回答必须相同。

考虑一个推荐框架,例如 Apache Mahout correlated co-occurance 中的框架。与 vanilla spark 推荐器不同,此实现允许多种类型的操作,例如查看网站、预订他们之前的旅行、人口统计信息等。

现在您可以在任何时间间隔为每个用户计算推荐。推荐基于多个标准以及与该用户相似的其他人所做的事情。在这种情况下,将您的“项目”视为世界上的每个目的地。因此,我们现在为每个用户对每个可能的目的地进行了排名。

这是一个简单的扩展,可以按用户/用户推荐目的地的有序列表索引弹性搜索。

例如,我们有一个用户访问过柏林,查看过维也纳的几家酒店,并且来自罗马尼亚。当用户输入“au”时,我们希望在结果中看到“Austria”比“Austrailia”高得多

根据 cmets 和否决票 - 您可能应该 A)问一个更具体的编程问题或 B)在另一个论坛上问这个问题,例如 Data Science Stack Exchange,fyi

【讨论】:

    猜你喜欢
    • 2018-12-11
    • 2012-10-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-12-25
    • 2022-12-10
    • 1970-01-01
    • 2015-01-27
    相关资源
    最近更新 更多