【发布时间】:2016-10-15 23:06:30
【问题描述】:
我正在尝试使用变压器从 2 个输入中生成 PCollection<C>(带有 C 类型的元素):一个 PCollection<A>(带有 A 类型的元素),第二个是 PCollection<C>。
基本上,转换器会考虑存储在PCollection<A> 中的元素,并对PCollection<C> 中的元素进行一些计算,最终它会生成一个带有新元素的新PCollection 作为输出。
那么,有没有什么方法可以使用PCollectionTuple 或ParDo 而不是PCollectionTuple 来实现这个场景,只产生一个输出PCollection,或者使用Google Dataflow SDK 的任何其他建议?
【问题讨论】:
标签: java google-cloud-dataflow dataflow