在公司一直使用ambari+hdp安装的spark2,但是这两天他们软件搬家,用不了,于是在自己的虚拟机上安装了一套用于测试一些小数据,之前安装的spark是standalone模式,所以想安装一套on yarn模式的,但是网上全都在乱写,明明master+worker是standalone的还一本正经说是 spark on yarn

安装scala

这是我安装的(忽略掉已经装好的spark,它是standalone模式的)

Spark On Yarn的安装和使用
毕竟都到安装spark了,所以相信之前的都已经装好了,所以直接从安装scala开始
下载https://www.scala-lang.org/download/2.11.8.html
解压:tar -zxvf scala-2.11.8.tgz -C /opt/module
配置环境变量:vim ~/.bashrc
export SCALA_HOME=/opt/module/scala
export PATH=SCALAHOME/bin:SCALA_HOME/bin:PATH
Spark On Yarn的安装和使用
生效:source ~/.brashrc
Spark On Yarn的安装和使用

Spark下载

下载:http://spark.apache.org/downloads.html
解压:tar -zxvf spark-2.4.4-bin-hadoop2.7.tgz
重命名:mv spark-2.4.4-bin-hadoop2.7 spark2
配置环境变量:vim ~/.bashrc
Spark On Yarn的安装和使用
生效:source ~/.bashrc
进入spark的conf目录下 cp spark-env.sh.template spark-env.sh
vim spark-env.sh
export HADOOP_HOME=HADOOPHOME:/opt/module/hadoopexportHADOOPCONFDIR={HADOOP_HOME:-/opt/module/hadoop} export HADOOP_CONF_DIR={HADOOP_CONF_DIR:-/opt/module/etc/hadoop}
export JAVA_HOME=/opt/module/jdk

因为是运行在yarn上的安装一台客户端就够了
启动hadoop相关
输入spark-shell --master yarn-client
出现以下就成功了
Welcome to
____ __
/ / ___ / /
\ / _ / _ `/ __/ '/
/
/ .__/_,// //_\ version 2.4.4
/
/

Using Scala version 2.11.8 (Java HotSpot™ 64-Bit Server VM, Java 1.8.0_112)
Type in expressions to have them evaluated.
Type :help for more information.

相关文章:

  • 2021-12-09
  • 2021-10-20
  • 2021-07-15
  • 2021-07-30
  • 2021-07-01
  • 2021-04-02
猜你喜欢
  • 2021-07-29
  • 2021-09-28
  • 2022-12-23
  • 2021-08-31
  • 2021-07-09
  • 2022-12-23
  • 2021-11-04
相关资源
相似解决方案