hiveSQL调优
数据经过iputformat进行节分格式化,输入map,执行计算,map输出将数据写到缓冲区,并计算分区(上图标注地方有问题),当写到一定的阀值会spill到磁盘,并进行排序,当map执行完会将各个map写出的小文件进行归并排序。map执行完后reduce会起一个fechoutservlet将数据拷贝到reduce节点,并进行合并排序,送入redcue,执行计算。做过服务端开发同学知道,图上的每个节点都是影响mapreduce执行效率的地方。影响在哪里见下一个章节

hive调优

相关文章:

  • 2021-06-26
  • 2021-05-24
  • 2021-11-05
  • 2022-12-23
  • 2021-07-28
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2021-10-04
  • 2021-11-30
  • 2021-09-05
  • 2022-02-12
  • 2021-05-11
相关资源
相似解决方案