【发布时间】:2019-04-29 21:36:50
【问题描述】:
我正在尝试运行此文件 .py 文件。我已经复制了 GCP 存储桶中的 dsgd_mf.py 文件。所需的输入数据文件也在我的存储桶中。如何火花提交并获得输出? (https://github.com/LiuShifeng/Matrix_Factor_Python/blob/master/dsgd_mf.py)
我在 GCP 上运行 Jupyter 笔记本并安装了 gcloud SDK。除了创建集群和运行 Jupiter notebook 之外,我还没有更改任何其他内容。我看到了一些与 .jar 文件有关的选项,但我不知道并且有任何 .jar 文件要指定或链接。我是新手,我们将不胜感激。请访问链接以查看脚本文件。我需要帮助才能在 Google 云平台上运行它。
【问题讨论】:
标签: python apache-spark google-cloud-platform pyspark spark-submit