【问题标题】:Need help picking a datamining/neural-network API需要帮助选择数据挖掘/神经网络 API
【发布时间】:2011-04-07 17:56:57
【问题描述】:

我正计划为我用 Java 开发的电子商务平台构建一个功能,以与亚马逊非常相似的方式显示相关产品。对于我想探索的相关产品,有几个不同的指标。

  • 购买历史(同时购买)
  • 按系列/类型相关(类似产品分类)
  • 故意相关(提升结果;“买这个!”)

虽然我可能能够开发自己的数据挖掘库,但它的可移植性不是很好,而且我敢说它也不是很好。

有几个包可以做这种事情,但我觉得我无法评估哪个包或解决方案最适合我。非常感谢任何轶事或个人经验的输入。

注意:我将其标记为神经网络,因为我在一次 Python 演讲中使用了类神经网络进行数据挖掘,我不相信神经网络是这项工作的最佳选择。

【问题讨论】:

  • 协同过滤似乎比神经网络更好地解决您的问题,因为您可能没有具有明显成本函数的一致训练集。 Mahout 得到很好的支持并基于 Hadoop,它是 Java map-reduce 框架。我没有这方面的经验,但我想我会尝试为您指明正确的方向。
  • @Adriaan Koster,你可能是对的 :)

标签: java neural-network data-mining


【解决方案1】:

【讨论】:

  • 我看过它,但我不知道它与所有其他平台相比如何,如果它能够满足我的要求,那真的是关键这里的问题。如果不花费大量时间或精力来评估每个选项,就不可能做出理性的选择。您对 Mahout 有任何经验或推荐它的理由吗?
  • 我相信您想要的是项目相似性的概念。 Mahout 在其基于项目的推荐框架中为此提供了一个相当简单的框架。查看其ItemSimilarity 接口的实现。该代码和相关代码应该可以满足您的需求。我会跟进user@mahout.apache.org
【解决方案2】:

有一些用于数据挖掘的人工算法技术,例如C4.5ID3。这些算法进行分类。蚂蚁聚类、神经网络或遗传算法等其他技术用于数据挖掘中的分类目的。

就算法而言,我不太了解,但 ID3/C4.5 可以轻松编程。

希望这会有所帮助。

【讨论】:

    猜你喜欢
    • 2011-02-28
    • 2015-01-29
    • 1970-01-01
    • 1970-01-01
    • 2020-10-15
    • 1970-01-01
    • 1970-01-01
    • 2017-05-16
    • 2017-09-03
    相关资源
    最近更新 更多