【发布时间】:2022-01-09 22:59:04
【问题描述】:
我有一张有很多分区的表(我们正在努力减少分区)
当我查询时:
SELECT * FROM mytable LIMIT 10
我明白了:
“HIVE_EXCEEDED_PARTITION_LIMIT:对表 'mytable' 的查询可能读取超过 1000000 个分区”
为什么查询的“LIMIT 10”部分不足以让 Athena 在不读取超过 1 或 3 个分区的情况下返回结果?
回答: 在查询计划阶段,Athena 会尝试列出回答查询可能需要的所有分区。 由于 Athena 不知道哪些分区实际包含数据(不是空分区),它会将所有分区添加到列表中。
【问题讨论】:
标签: amazon-athena presto