【发布时间】:2017-08-27 20:25:22
【问题描述】:
我有以下文件tax_cal 我想在猪中加载:
101,5|2;3|2
102,3|1;4.5|2;4|1
103,2|1;5|2;5.6|3
输出:
101,5|2,3|2
102,3|1,4.5|2,4|1
103,2|1,5|2,5.6|3
此外,我会将这个输出文件传递给 python UDF 以计算总价格。
我怎样才能做到这一点?
【问题讨论】:
-
你能添加文件的第一行,你需要使用 pig 加载吗
-
抱歉没听明白?
标签: python apache-pig hadoop-streaming