【问题标题】:Spark Serialization: How Tungsten and Kryo work together?Spark 序列化:Tungsten 和 Kryo 如何协同工作?
【发布时间】:2018-06-20 03:24:32
【问题描述】:

我正在阅读有关 Spark 优化的文章,但不清楚 Tungsten序列化 像 Kryo 是如何协同工作的。

我正在阅读的资料来源中的一些注释让我想到了这个问题:

  • “Tungsten 的表示形式远小于使用 Java 甚至 Kryo 序列化程序序列化的对象。” source-hortonworks

  • “通过代码生成,我们可以提高序列化的吞吐量,进而提高 shuffle 网络的吞吐量。” source-databricks

【问题讨论】:

    标签: apache-spark serialization kryo


    【解决方案1】:

    他们没有,不包括一些边界情况,比如Encoders.kryo

    Tungsten 使用它自己的二进制存储格式和相应的 serde 工具 (Encoders)。这就是为什么它可以在标准操作模式下更快、内存效率更高的原因。

    【讨论】:

    • 谢谢。那么当“默认情况下,Spark 使用 Java 的 ObjectOutputStream 框架序列化对象”时,如何使用 Tungsten? @user9963938
    猜你喜欢
    • 1970-01-01
    • 2016-07-02
    • 2015-05-23
    • 2015-12-18
    • 1970-01-01
    • 2015-04-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多