Hadoop生态圈

Linux: 操作系统
Hadoop: 解决海量数据的分布式存储分布式计算
Hbase 大数据的数据库,列式存储的数据(可存储TB,EB以上的数据)
Hive: 数据仓库
scala: 函数式编程(一种语言)
Spark: 准实时计算的一个框架
SparkSQL: 是一种交互式查询应用服务
SparkStreaming: 流式计算
Flume: 数据采集
Kafka: 消息队列
storm: 不处理静态数据,但它处理连续的流数据。
flink: 用于对无界和有界数据流进行有状态计算
zookeeper: 管理,协调以上技术
Hadoop生态圈

相关文章:

  • 2021-10-29
  • 2021-11-05
  • 2022-12-23
  • 2022-12-23
猜你喜欢
  • 2021-12-27
  • 2021-07-03
  • 2021-10-12
相关资源
相似解决方案