【发布时间】:2018-07-20 20:09:14
【问题描述】:
我正在尝试使用 Apache Beam 创建数据流管道,但我无法遵循文档,也找不到任何示例。
管道很简单。
- 创建管道
- 从发布/订阅主题中读取
- 写信给扳手。
目前,我被困在第 2 步。我找不到任何关于如何从 pub/sub 读取并使用它的示例。
这是我到目前为止想要的代码
class ExtractFlowInfoFn extends DoFn<PubsubMessage, KV<String, String>> {
public void processElement(ProcessContext c) {
KV.of("key", "value");
}
}
public static void main(String[] args) {
Pipeline p = Pipeline.create(
PipelineOptionsFactory.fromArgs(args).withValidation().create());
p.apply("ReadFromPubSub", PubsubIO.readMessages().fromSubscription("test"))
.apply("ConvertToKeyValuePair", ParDo.of(new ExtractFlowInfoFn()))
.apply("WriteToLog", ));
};
通过遵循多个示例,我能够想出代码。老实说,我不知道我在这里做什么。
请帮助我理解这一点或将我链接到正确的文档。
【问题讨论】:
标签: google-cloud-dataflow apache-beam google-cloud-spanner