【问题标题】:Finding data statistics using mahout使用 mahout 查找数据统计信息
【发布时间】:2015-01-28 16:19:57
【问题描述】:

我是 mahout 的新手,我正在尝试找到如何利用我的数据集来呈现一些关系。我有一个这样的数据集

IPs,timestamp,bytes_tranferred

我可以从这个集合中得出什么不同的关系,以便我可以使用 mahout 呈现一些有意义的值。目前我计划使用这个集合来表示哪个客户端(在 IP 列中)在给定时间内有更多的流量。所以我猜我将不得不将IP组合在一起。有没有更好的想法以及如何使用 JAVA 代码来实现。请建议。

提前致谢

【问题讨论】:

    标签: mahout


    【解决方案1】:

    基本上这取决于您的要求。您可以计算一段时间内的数据传输,IP 在一段时间内进行数据传输等。但是要计算,您不需要 mahout 框架,简单的 MR 工作可以完成所有这些。

    【讨论】:

    • 这就是我需要各位专家的建议,如果我必须使用 mahout,那么我可以创建哪些用例,我可以使用 mahout 向用户提供这些字段的一些统计信息。跨度>
    猜你喜欢
    • 2012-02-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-05-09
    • 1970-01-01
    • 2023-02-08
    • 2011-05-15
    • 1970-01-01
    相关资源
    最近更新 更多