【问题标题】:Schema evolution for avro, orc, parquet formatsavro、orc、parquet 格式的模式演变
【发布时间】:2021-07-18 19:55:33
【问题描述】:
在模式演化方面,我的理解是它应该是一个二元的答案(是或否)。但在上图中,它分别显示了 100%、25% 和 50% 的饼图。这是什么概念?
【问题讨论】:
标签:
schema
avro
parquet
orc
【解决方案1】:
-
Avro 支持添加新列、重命名(别名)和删除列。
-
ORC with Hive 支持添加新列和更改列类型。
-
Parquet 支持添加新列。
看起来这就是使用图像表示的内容。