• mapreduce和hdfs采用java实现,默认提供java编程接口
  • streaming框架允许任何程序语言实现的程序在hadoop mapreduce中使用
  • streaming方便已有的程序向hadoop平台移植

streaming原理图

 

streaming简介

streaming局限

  • streaming默认只能处理文本数据,如果要对二进制数据进行处理,比较好的方法是将二进制的key和value进行base64的编码转化成文本即可。
  • 两次数据拷贝和解析,带来一定的开销。

 

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2022-01-09
  • 2021-06-07
  • 2021-05-12
  • 2021-05-31
  • 2021-08-01
猜你喜欢
  • 2021-05-27
  • 2022-02-19
  • 2021-10-29
  • 2022-12-23
  • 2021-12-21
  • 2021-11-22
相关资源
相似解决方案