【发布时间】:2018-04-16 21:47:49
【问题描述】:
我是 Hadoop 和 pig 的新手。根据问题,我可以深入到下面的脚本,但是我如何将人的薪水与其部门的平均薪水进行比较。以下是获取各部门平均工资的脚本
A = LOAD 'Assignment_1_Input.log' USING PigStorage('\t') as (id:int,name:chararray,age:int,salary:int,deptid:int);
B = GROUP A by deptid;
STORE B INTO 'Assign1GrpByNew';
C = FOREACH B GENERATE group as grpId,AVG(A.salary) as grpAvgSal;
DUMP C;
输入文件:
15878 mohan 24 8000 1
19173 ramya 27 10000 1
9527 krishna 35 40000 2
9528 raj 36 60000 2
16884 ravi 50 70000 2
预期输出
ramya 1
raj 2
ravi 2
帮帮我,谢谢
【问题讨论】:
标签: bigdata apache-pig hadoop2