【问题标题】:How do I start pyspark with Jupyter options inline?如何使用内联的 Jupyter 选项启动 pyspark?
【发布时间】:2019-11-05 23:55:30
【问题描述】:

我正在尝试使用Jupyter Lab 选项(内联)运行pyspark,如下所示。

PYSPARK_DRIVER_PYTHON="jupyter" PYSPARK_DRIVER_PYTHON_OPTS="notebook --NotebookApp.notebook_dir='/' --NotebookApp.port=4444" $SPARK_HOME/bin/pyspark

这种方法的灵感来自official documentation。但是,当命令执行时,notebooks 目录是从/root 服务的,端口仍然是8888

我还将执行包装在 .sh (shell) 文件中,名称为 follows

#!/bin/bash

export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook --NotebookApp.notebook_dir='/' --NotebookApp.port=4444"

pyspark "$@"

但是这种覆盖笔记本目录和端口的尝试也不起作用。我已检查以确保 /root/.jupyter/jupyter_notebook_config.py 不存在。

关于这里有什么问题的任何想法?

【问题讨论】:

    标签: python apache-spark pyspark jupyter-notebook


    【解决方案1】:

    没关系,我关注了这个post 并在spark-env.sh 中有hard-coded 的环境变量。删除这些变量后,一切正常。

    【讨论】:

      猜你喜欢
      • 2021-11-23
      • 1970-01-01
      • 2015-06-11
      • 1970-01-01
      • 2017-09-12
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多