【问题标题】:Can we create Dataproc Workflow Template by passing a path of Jupyter notebooks in step_id?我们可以通过在 step_id 中传递 Jupyter 笔记本的路径来创建 Dataproc 工作流模板吗?
【发布时间】:2021-09-11 23:01:47
【问题描述】:

我一直在尝试创建 Dataproc 工作流模板来执行存在于我的 Dataproc 集群上的 Jupyter 笔记本,但是当我实例化该模板时,作业会失败,而如果我将笔记本下载为 .py 文件,然后将它们添加到工作流模板中有效。

我只是好奇是否有任何方法可以创建一个可以直接将现有 Jupyter 笔记本作为其步骤的工作流模板。

【问题讨论】:

    标签: python google-cloud-platform google-cloud-dataproc dataproc


    【解决方案1】:

    Dataproc 尚不支持通过作业和工作流模板 API 直接执行 Jupyter 笔记本。

    您可以通过编写并提交将使用nbconvert to execute a notebook 的 PySpark 作业/工作流模板步骤来解决此问题。

    【讨论】:

      猜你喜欢
      • 2018-03-30
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2023-03-08
      • 1970-01-01
      • 1970-01-01
      • 2018-04-13
      相关资源
      最近更新 更多