【问题标题】:zeppelin unable to import pandas, numpy, scipyzeppelin 无法导入 pandas、numpy、scipy
【发布时间】:2017-01-06 09:53:19
【问题描述】:

用 zeppelin 编写的代码,当我在那里启动 pyspark 时,它在 shell 中工作和导入正常,但在 zeppelin 中却没有使用相同的代码。

 %pyspark
import pandas

Traceback (most recent call last):
  File "/tmp/zeppelin_pyspark-4245945050627073162.py", line 239, in <module>
    eval(compiledCode)
  File "<string>", line 1, in <module>
ImportError: No module named pandas

【问题讨论】:

    标签: pyspark apache-zeppelin


    【解决方案1】:

    这是因为机器上没有安装 pandas。

    如果没有安装pip,先安装pip。

    sudo curl --silent --show-error https://bootstrap.pypa.io/get-pip.py | python
    

    然后安装熊猫

    sudo pip install pandas
    

    或者像这样使用 [docker]。

    docker run -d -p 8080:8080 -t knockdata/zeppelin-highcharts
    

    zeppelin-highcharts 图像包含 pandas 和 Highcharts 功能。

    【讨论】:

    • 当我使用 PySpark 导入时,我提到它工作正常。那么如果机器中没有安装 pandas,那么它如何与 Pyspark 一起工作?
    • 可能它没有使用相同的python。检查sys.path是否相同。尝试在 Zeppelin 中将 zeppelin.pyspark.python 配置为与 pyspark 中使用的相同
    • 我无法登录托管 zeppelin 的机器。如何在 zeppelin notebook 中安装软件包?我的意思是,在 zeppelin notebook 中使用 pip。
    • @Mithril 我知道你很久以前就问过这个问题,但它可能会在未来对其他人有所帮助。要从笔记本安装,请创建一个段落,然后键入: %sh pip install pandas 完成后,重新启动 python 解释器以进行导入以找到包。
    猜你喜欢
    • 2018-11-02
    • 2015-02-06
    • 2018-01-11
    • 2014-08-17
    • 1970-01-01
    • 2013-03-09
    • 2016-11-06
    • 2019-10-25
    • 2022-11-23
    相关资源
    最近更新 更多