【发布时间】:2018-03-30 17:35:23
【问题描述】:
我对 Hadoop 等大数据工具的使用非常陌生。我想在 Yarn/或 Yarn Simulator 上执行一个公开可用的集群跟踪 (https://github.com/google/cluster-data)。
一种方法是通过 Gridmix 将输入输入 Yarn。
Gridmix (https://hadoop.apache.org/docs/r2.8.3/hadoop-gridmix/GridMix.html) 接受输入的格式基本上是 Rumen 的输出。 Rumen (https://hadoop.apache.org/docs/r2.8.3/hadoop-rumen/Rumen.html) 将从 map-reduce 集群生成的 JobHistory 日志作为输入。
google 跟踪不是 map-reduce 跟踪。但是,我想知道是否可以将其转换为与 Grdimix 作为输入的格式相同的格式,然后我可以使用 Grdmix。
这里有人能指出 Gridmix 的输入格式(或 Rumen 的输出)吗?
或者建议我另一种方法来做我想做的事?
谢谢。
【问题讨论】: