【发布时间】:2018-06-20 03:24:32
【问题描述】:
我正在阅读有关 Spark 优化的文章,但不清楚 Tungsten 和 序列化 像 Kryo 是如何协同工作的。
我正在阅读的资料来源中的一些注释让我想到了这个问题:
“Tungsten 的表示形式远小于使用 Java 甚至 Kryo 序列化程序序列化的对象。” source-hortonworks
“通过代码生成,我们可以提高序列化的吞吐量,进而提高 shuffle 网络的吞吐量。” source-databricks
【问题讨论】:
标签: apache-spark serialization kryo