基于Hadoop集群的Spark集群搭建

基于Hadoop集群的Spark集群搭建

一. 单机版Spark搭建

(1)将下载下来的软件包拉至集群中(主节点上)
基于Hadoop集群的Spark集群搭建
(2)解压至指定目录

(3)将解压下的文件移至某个特定目录下并查看

(4)修改环境变量

(5)使环境变量生效并进入scala命令行测试；

(6）解压scala压缩包并放置指定目录；

(7)添加环境变量

(8)生效环境变量并测试spark(source .bash_profile)
基于Hadoop集群的Spark集群搭建
(9)单机版网页spark测试(主机地址为你当前虚拟机地址，在启动spark的时候你可以看到)

二. 集群版Spark搭建

(1)修改spark配置文件(注意目录)
基于Hadoop集群的Spark集群搭建
(2)修改配置文件(加入你集群的主机名)

(3)生成配置文件并修改配置文件(jdk为你本机安装位置)

(4)向集群中其他主机发送

(5)启动Hadoop集群(start-all.sh),启动spark集群(在spark目录下的sbin目录下启动)(主节点启动有Master，从节点为Worker)
基于Hadoop集群的Spark集群搭建
(6)查看端口

基于Hadoop集群的Spark集群搭建
(7)Web端访问(此时你输入你的"主节点IP+7077">是访问不到的)，需要添加本地映射端口

至此，Spark集群搭建完毕。

相关文章：

猜你喜欢

相关资源

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode