【发布时间】:2014-01-17 04:11:03
【问题描述】:
我们可以使用Hive 和MapReduce 中的combination
说:我有一个 csv 文件。我需要找到一列的mean 并将空数据替换为平均值(replace null with mean)。
所以我们是否可以在驱动程序中写一个hive query(找到平均值)然后写一个mapreduce块来用平均值替换空值。
哪个更好
- 只编写 mapreduce 代码或
- 结合使用 hive 和 mapreduce。
【问题讨论】:
标签: java hadoop mapreduce hive