【发布时间】:2015-01-28 16:19:57
【问题描述】:
我是 mahout 的新手,我正在尝试找到如何利用我的数据集来呈现一些关系。我有一个这样的数据集
IPs,timestamp,bytes_tranferred
我可以从这个集合中得出什么不同的关系,以便我可以使用 mahout 呈现一些有意义的值。目前我计划使用这个集合来表示哪个客户端(在 IP 列中)在给定时间内有更多的流量。所以我猜我将不得不将IP组合在一起。有没有更好的想法以及如何使用 JAVA 代码来实现。请建议。
提前致谢
【问题讨论】:
标签: mahout