【发布时间】:2015-08-30 01:13:29
【问题描述】:
我很难理解 Avro、Kryo 和 Parquet 在 Spark 环境中的作用。它们都与序列化有关,但我见过它们一起使用,所以它们不能做同样的事情。
Parquet 将其自身描述为一种列式存储格式,我有点明白这一点,但是当我保存 Parquet 文件时,Arvo 或 Kryo 是否与它有任何关系?或者它们仅在火花工作期间相关,即。用于在洗牌期间通过网络发送对象或溢出到磁盘? Arvo 和 Kryo 有何不同?将它们一起使用会发生什么?
【问题讨论】:
标签: apache-spark kryo parquet