【发布时间】:2018-05-24 01:01:14
【问题描述】:
我有两个 bigquery 表。
表 A
c_id count_c_id p_id
表 B
id c_name p_type c_id
基于表 A 中的列,我需要使用 DF 管道从表 B 中查找详细信息。
PCollection<TableRow> tableRowBQ = pipeline.apply(BigQueryIO.Read
.named("Read").fromQuery("select c_id,count_c_id,p_id from TableA"));
我的要求是基于此查询返回的 c_id 我应该能够使用 pcollection 从 TableB 中获取 c_name。我找不到任何 pcollection 示例,用于从一个表中迭代字段并使用该字段从另一个表中获取数据。
Google 团队共享的示例作为参考。 https://github.com/GoogleCloudPlatform/DataflowSDK-examples/blob/master-1.x/src/main/java/com/google/cloud/dataflow/examples/cookbook/JoinExamples.java.
【问题讨论】:
标签: java google-bigquery google-cloud-dataflow