【发布时间】:2016-07-13 11:10:05
【问题描述】:
我可以使用 https://cloud.google.com/dataproc/tutorials/jupyter-notebook 成功运行带有 pyspark 的 jupyter
我的问题是 - 如果我必须将包添加到 pyspark(如 spark-csv 或 graphframes)并通过笔记本使用它们,那么最佳做法是什么? 我可以使用 --packages 选项将包添加到新的 pyspark 作业中,但是如何将新的 pyspark 上下文连接到笔记本?
【问题讨论】:
标签: pyspark jupyter-notebook gcloud google-cloud-dataproc