【发布时间】:2018-09-27 14:00:14
【问题描述】:
我正在加载两个数据集 A、B
A= LOAD [datapath]
B= LOAD [datapath]
我想通过 id 字段加入 A 和 B 的所有字段。A 和 B 都有共同的字段 id 和其他字段。当我通过 id 执行 JOIN 时:
AB= JOIN A by id, B by id;
生成的数据集 AB 包含两个相似的字段 id 列,但是,它必须只显示 id 字段的一列。我在这里做错了什么?
【问题讨论】:
标签: hadoop hdfs bigdata apache-pig