【发布时间】:2017-06-27 20:34:27
【问题描述】:
我有一个在 EMR 中运行的 spark 集群。我还有一个在第二台 EC2 机器上运行的 jupyter 笔记本。我想通过 jupyter 在我的 EC2 实例上使用 spark。我正在寻找有关如何配置 spark 以从 EC2 访问 EMR 集群的参考资料。搜索只为我提供了有关如何在 EMR 或 EC2 上设置 spark 的指南,而不是如何从另一个访问其中一个。
我在这里看到了一个类似的问题:
Sending Commands from Jupyter/IPython running on EC2 to EMR cluster
但是,那里的设置使用引导操作来设置 zeppelin,我不确定如何在 EC2 上编辑我的 hadoop 配置。
【问题讨论】:
-
您应该能够设置您的 Spark
master==IP[X]。只需确保您的安全组已设置为允许您执行此操作即可。
标签: amazon-web-services apache-spark amazon-ec2 pyspark jupyter-notebook