Hadoop生态系统主要架构图汇总

 

1 hadoop1.0时期架构

Hadoop生态系统主要架构

hadoop1.0时期架构

2 hadoop2.0时期架构

Hadoop生态系统主要架构

hadoop2.0时期架构

3 hdfs架构

Hadoop生态系统主要架构

hdfs架构

Active Namenode】:主 Master(只有一个),管理 HDFS 的名称空间,管理数据块映射信息;配置副本策略;处理客户端读写请求

Secondary NameNode】:NameNode 的热备;定期合并 fsimage 和 fsedits,推送给 NameNode;当 Active NameNode 出现故障时,快速切换为新的 Secondary NameNode。

Datanode】:Slave(有多个);存储实际的数据块;执行数据块读 / 写

Client】:与 NameNode 交互,获取文件位置信息;与 DataNode 交互,读取或者写入数据;管理 HDFS、访问 HDFS。

4 MapReduce架构

 

Hadoop生态系统主要架构

MapReduce架构

Hadoop生态系统主要架构

MapReduce架构

Hadoop生态系统主要架构

MapReduce架构

Hadoop生态系统主要架构

MapReduce架构

5 yarn架构

 

Hadoop生态系统主要架构

yarn架构

6 hadoop1.0与hadoop2.0比较图

 

Hadoop生态系统主要架构

hadoop1.0与hadoop2.0比较图

7、Hive(基于MR的数据仓库)

由Facebook开源,最初用于海量结构化日志数据统计;ETL(Extraction-Transformation-Loading)工具构建在Hadoop之上的数据仓库;数据计算使用 MapReduce,数据存储使用HDFS
Hive 定义了一种类 SQL 查询语言——HQL
类似SQL,但不完全相同
通常用于进行离线数据处理(采用 MapReduce);可认为是一个 HQL→MR 的语言翻译器

8、Hbase(分布式数据库)

源自 Google 的 Bigtable 论文
发表于 2006 年 11 月
Hbase 是 Google Bigtable 克隆版

 



作者:小小少年Boy
链接:https://www.jianshu.com/p/061040243935
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

相关文章:

  • 2021-08-27
  • 2021-12-04
  • 2021-10-26
猜你喜欢
  • 2022-02-21
  • 2021-07-01
  • 2021-09-22
  • 2022-12-23
  • 2021-08-21
  • 2021-05-01
相关资源
相似解决方案