【发布时间】:2018-11-29 05:21:18
【问题描述】:
我了解到基于 Apache Beam SDK 的 Google Cloud Dataflow 管道可以使用 Spark 或 Flink 运行。
我目前使用默认的 Cloud Dataflow 运行器在 GCP 上运行一些数据流管道,我想使用 Spark 运行器运行它,但我不知道如何操作。
是否有任何关于如何执行此操作的文档或指南?任何指针都会有所帮助。
谢谢。
【问题讨论】:
标签: apache-spark google-cloud-platform google-cloud-dataflow apache-beam