Spark 序列化：Tungsten 和 Kryo 如何协同工作？

【问题标题】：Spark Serialization: How Tungsten and Kryo work together?Spark 序列化：Tungsten 和 Kryo 如何协同工作？
【发布时间】：2018-06-20 03:24:32
【问题描述】：

我正在阅读有关 Spark 优化的文章，但不清楚 Tungsten 和 序列化 像 Kryo 是如何协同工作的。

我正在阅读的资料来源中的一些注释让我想到了这个问题：

“Tungsten 的表示形式远小于使用 Java 甚至 Kryo 序列化程序序列化的对象。” source-hortonworks
“通过代码生成，我们可以提高序列化的吞吐量，进而提高 shuffle 网络的吞吐量。” source-databricks

【问题讨论】：

标签： apache-spark serialization kryo

【解决方案1】：

他们没有，不包括一些边界情况，比如Encoders.kryo。

Tungsten 使用它自己的二进制存储格式和相应的 serde 工具 (Encoders)。这就是为什么它可以在标准操作模式下更快、内存效率更高的原因。

【讨论】：

谢谢。那么当“默认情况下，Spark 使用 Java 的 ObjectOutputStream 框架序列化对象”时，如何使用 Tungsten？ @user9963938

猜你喜欢

1970-01-01
2016-07-02
2015-05-23
2015-12-18
1970-01-01
2015-04-17
1970-01-01
1970-01-01
1970-01-01

相关资源

下载 2021-06-24
下载 2023-02-14
下载 2023-01-05

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode