【发布时间】:2014-09-11 13:38:22
【问题描述】:
我们计划将 Apache Pig 代码迁移到新的 Spark 平台。
Pig 具有“Bag/Tuple/Field”概念,其行为类似于关系数据库。 Pig 提供对 CROSS/INNER/OUTER 连接的支持。
对于 CROSS JOIN,我们可以使用alias = CROSS alias, alias [, alias …] [PARTITION BY partitioner] [PARALLEL n];
但是当我们迁移到 Spark 平台时,我在 Spark API 中找不到任何对应物。你有什么想法吗?
【问题讨论】:
-
它还没有准备好,但目前正在构建 spork(pig on spark),所以你可能不需要更改任何代码