【发布时间】:2020-02-02 05:56:49
【问题描述】:
我有一个 BigQuery TableRow 元素的 PCollection,这些元素的标记取决于 TableRow 的一列是否已成功解析。
final TupleTag<TableRow> OK = new TupleTag<TableRow>(){};
final TupleTag<TableRow> NOTOK = new TupleTag<TableRow>(){};
我的 ParDo 函数根据列解析标记这些 TableRow,并返回一个名为 myPCollection 的 PCollectionTuple。
我想做以下事情:
- 获取 PCollection 中的所有元素(标记为 OK 和 NOTOK),并将它们输出到 BigQuery。
- 仅获取标记为 NOTOK 的元素并将它们发送到 Pub/Sub
我知道我可以通过调用来完成 #2
myPCollection.get(NOTOK)
我找不到第 1 项的方法。我看到有一个名为 myPCollection.getAll() 的方法,但它返回的不是 PCollection,而是 Map,PCollection>
关于如何获取整个元素集(无论它们如何标记)的任何想法?
【问题讨论】:
标签: google-cloud-dataflow apache-beam