【发布时间】:2017-07-27 04:23:10
【问题描述】:
像这样使用 spark-submit 提交 python 脚本与简单地运行带有 python 可执行文件(并导入 SparkSession)的 .py 文件是否有优缺点,或者可能有不同的用例?
from pyspark.sql import SparkSession
spk = SparkSession.builder.master(master).getOrCreate()
基本上,通过python 而不是 spark-submit 运行脚本有什么不同。
【问题讨论】:
-
pyspark 在 spark shell 中运行,是吗?在这种情况下,我只想通过
python运行脚本,而不是 spark-submit。
标签: apache-spark pyspark