【发布时间】:2014-12-29 22:23:33
【问题描述】:
在我们的一个项目中,我们使用 Kafka 和 AVRO 来跨应用程序传输数据。数据被添加到 AVRO 对象,对象被二进制编码以写入 Kafka。我们使用二进制编码,因为它通常被认为是与其他格式相比的最小表示。
数据通常是 JSON 字符串,当它保存在文件中时,它最多使用 10 Mb 的磁盘。但是,当文件被压缩 (.zip) 时,它只使用几个 KB。我们关心将此类数据存储在 Kafka 中,因此在写入 Kafka 主题之前尝试进行压缩。
当测量二进制编码消息的长度(即字节数组的长度)时,它与数据字符串的长度成正比。所以我假设二进制编码不会减少任何大小。
谁能告诉我二进制编码是否压缩数据?如果没有,我该如何应用压缩?
谢谢!
【问题讨论】:
标签: avro