【发布时间】:2021-02-25 19:24:07
【问题描述】:
我希望使用 Athena Partition Projection 来分析来自 AWS 应用程序负载均衡器的日志文件和 firehose 发出的日志。 S3 中的数据以年/月/日为前缀,可能还有小时。我已经能够使用Firehose Example 完成;但是这个例子使用了一个字符串格式的分区列。
我正在寻找是否可以改用日期格式的分区列(使用分区项目和 firehose 发出的 s3 前缀格式),因为我们的查询编写器已经习惯了我们大多数涉及日期列的查询,并且它避免了相对日期查询需要字符串格式。这是可能的还是需要更改 s3 前缀才能完成?
字符串列的表格属性:WORKS
PARTITIONED BY (
`logdate` string)
TBLPROPERTIES (
'projection.enabled'='true',
'projection.logdate.format'='yyyy/MM/dd',
'projection.logdate.interval'='1',
'projection.logdate.interval.unit'='DAYS',
'projection.logdate.range'='NOW-2YEARS,NOW',
'projection.logdate.type'='date',
'storage.location.template'='s3://bucket/prefix/${logdate}')
日期分区列的表属性不起作用
PARTITIONED BY (
`logdate` date)
TBLPROPERTIES (
'projection.enabled'='true',
'projection.logdate.format'='yyyy/MM/dd',
'projection.logdate.interval'='1',
'projection.logdate.interval.unit'='DAYS',
'projection.logdate.range'='NOW-2YEARS,NOW',
'projection.logdate.type'='date',
'storage.location.template'='s3://bucket/prefix/${logdate}')
HIVE_INVALID_PARTITION_VALUE:DATE 分区键的分区值“2018/11/13”无效:logdate=2018%2F11%2F13
【问题讨论】:
-
这两个
TBLPROPERTIES列表是相同的。您能否使用有效的属性更新问题?另外,请发布您的分区键及其类型。
标签: amazon-web-services amazon-athena