1、数据完整性的保证:校验和

2、压缩的重要性及各种压缩算法的适用场景(时间性、空间性,以及是否支持mapreduce)

3、writable序列化框架:为什么不用java序列化的东西,该框架的好处(精简、快速、可拓展、可以互操作等)

4、Text与String的区别:Text通过字节的偏移量进行索引(还有其他区别)

5、基于文件的数据结构:sequenceFile、MapFile以及他们的扩展

6、Avro数据序列化系统

相关文章:

  • 2022-12-23
  • 2021-06-17
  • 2021-06-29
  • 2021-08-31
猜你喜欢
  • 2022-12-23
  • 2021-08-14
  • 2021-10-08
相关资源
相似解决方案