【问题标题】:How to schedule Spark jobs on Google Dataproc?如何在 Google Dataproc 上安排 Spark 作业?
【发布时间】:2020-08-24 09:51:44
【问题描述】:

我想使用 Dataproc 在 Google Cloud 上创建一个摄取/聚合流,我希望 Spark 作业每天/每小时一次在收集到的数据上运行。

有没有办法安排 Spark 作业?或者使这个触发器基于例如是否有任何新的数据事件到达流?

【问题讨论】:

  • 你找到你需要的方式了吗
  • @HashanMalawana Henry 的回答非常适合调度和触发,我们可以使用 Cloud Functions。
  • 谢谢,我会看到的。

标签: google-cloud-platform google-cloud-dataproc


【解决方案1】:

Dataproc Workflow + Cloud Scheduler 可能是您的解决方案。它完全支持您所描述的内容,例如在日常基地中运行一系列工作。

【讨论】:

    猜你喜欢
    • 2020-03-13
    • 1970-01-01
    • 1970-01-01
    • 2023-03-18
    • 1970-01-01
    • 1970-01-01
    • 2022-10-03
    • 1970-01-01
    • 2019-04-22
    相关资源
    最近更新 更多