某个reduce中的value堆积的对象过多,导致jvm频繁GC。

 

解决办法:

1. 增加reduce个数,set mapred.reduce.tasks=300,。

2. 在hive-site.xml中设置,或者在hive shell里设置 set  mapred.child.java.opts = -Xmx512m

   或者只设置reduce的最大heap为2G,并设置垃圾回收器的类型为并行标记回收器,这样可以显著减少GC停顿,但是稍微耗费CPU。

   set mapred.reduce.child.java.opts=-Xmx2g -XX:+UseConcMarkSweepGC;

3. 使用map join 代替 common join. 可以set hive.auto.convert.join = true

4. 设置 hive.optimize.skewjoin = true 来解决数据倾斜问题

相关文章:

  • 2022-01-07
  • 2021-08-12
  • 2021-04-25
  • 2021-06-22
  • 2023-03-17
  • 2021-05-16
  • 2022-12-23
  • 2022-01-22
猜你喜欢
  • 2022-01-22
  • 2021-06-22
  • 2022-12-23
  • 2021-12-10
  • 2021-04-28
  • 2022-01-01
  • 2021-12-03
相关资源
相似解决方案