【发布时间】:2021-12-08 04:47:41
【问题描述】:
我正在尝试使用 Redshift Spectrum 来查询 s3 中的数据。数据已被 Glue 抓取,我已使用 DataBrew 对文件运行成功的数据分析作业(因此我知道 Glue 已正确读取它),并且在创建架构后我可以在查询编辑器中看到正确的表。但是当我尝试运行简单的查询时,我得到了两个错误之一:如果它是一个小文件,我得到:“错误:解析的清单不是有效的 JSON 对象......”;如果它是一个大文件,我会得到:“错误:清单太大细节:...”。我怀疑它正在寻找或相信查询中的文件是清单,但我不知道为什么或如何解决它。我已尽可能严格地遵循文档,并通过屏幕共享复制了该过程,并与同样被难住的 AWS 技术支持代表分享。
【问题讨论】:
标签: amazon-redshift manifest aws-glue aws-glue-data-catalog amazon-redshift-spectrum