【发布时间】:2020-11-05 00:13:21
【问题描述】:
我有按年/月/日分区的压缩 JSON 数据的 S3。 我在想,如果构造查询的过滤看起来像这样,它可能会减少扫描的数据量:
...
AND year = 2020
AND month = 10
AND day >= 1 "
ORDER BY year, month, day DESC
LIMIT 1
这种分区、排序和限制的组合是减少每次查询扫描的数据量的有效措施吗?
【问题讨论】:
-
@luk2302 正如我的问题的第一行所述,它是这样划分的 /year=someyear/month=somemonth/day=someday/crawlid=someid
-
菲利普给了你一个很好的答案,你应该接受它。 ORDER BY force athena 扫描您的所有数据。但没有它,分区和限制会减少扫描的数据。
标签: amazon-web-services amazon-s3 amazon-athena