【问题标题】:Java UDF on Hadoop input parameter -- call from Pig on HadoopJava UDF on Hadoop 输入参数——从 Pig on Hadoop 调用
【发布时间】:2016-05-09 22:07:43
【问题描述】:

如果我在 Pig 中有以下数据结构(关系)并且我想将其传递给 Java UDF,想知道输入参数的相关 Java 数据类型应该是什么?

(学生关系是一个bag,schema是ID as int,一个tuple包含一个interest bag和一个classes bag)。

student: {id: int,(interest: {(value: chararray)},classes: {(value: chararray)})}

提前致谢, 林

【问题讨论】:

    标签: java hadoop apache-pig user-defined-functions udf


    【解决方案1】:

    我认为可以如下图所示。

     public class BagUdf extends EvalFunc<DataBag> {
    
    public <returnType> exec(Tuple input) throws IOException {
    //iterate over the bag elements
    for (Tuple t : (DataBag)input.get(0)) {
         // process tuple t
    }
    return returnVal;
    }
    

    请参考这个link

    【讨论】:

    • 感谢 SurjanSRawat,投票并将您的回复标记为答案。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2016-11-15
    • 2011-05-09
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-07-19
    • 1970-01-01
    相关资源
    最近更新 更多