【发布时间】:2014-06-17 22:57:26
【问题描述】:
我有一个包装外壳脚本,它读取输入文件并多次调用猪脚本。这在 crontab 上运行良好。但是,在尝试使用 oozie 引擎时不起作用。如何在 oozie 中实现循环。如果这不是正确的方法,有人可以建议替代方法吗?我需要能够从输入文件中读取一些参数,然后为每一行(和相应的读取参数)多次调用猪脚本或猪动作。
读行时
do
seedidprefix=$(echo $line |awk -v OFS='\t' '{print $3;}')
seedaudprefix=$(echo $line |awk -v OFS='\t' '{print $2;}')
adgrpid=$(echo $line |awk -v OFS='\t' '{print $1;}')
nwtype=$(echo $line |awk -v OFS='\t' '{print $4;}')
chainedseedid=$(echo $line |awk -v OFS='\t' '{print $5;}')
if [ $nwtype == "ADX" ]; then
hadoop jar pig.jar -param segid=${seedaudprefix} -param nw=${nwtype} -param date=${MODELDATE} -param seedid=${seedidprefix} -param audienceId=${adgrpid} -param chainedseedid=${chainedseedid} ${TOP_DIR}/histo_bkup_adx.pig
else
hadoop jar pig.jar -param segid=${seedaudprefix} -param nw=${nwtype} -param date=${MODELDATE} -param seedid=${seedidprefix} -param audienceId=${adgrpid} -param chainedseedid=${chainedseedid} ${TOP_DIR}/histo_bkup.pig
fi
done<${campaign_file}
【问题讨论】:
-
你为什么要循环播放?你能举个数据例子吗?
标签: apache-pig oozie