【问题标题】:Insight into Redshift Spectrum query error洞察 Redshift Spectrum 查询错误
【发布时间】:2021-12-08 04:47:41
【问题描述】:

我正在尝试使用 Redshift Spectrum 来查询 s3 中的数据。数据已被 Glue 抓取,我已使用 DataBrew 对文件运行成功的数据分析作业(因此我知道 Glue 已正确读取它),并且在创建架构后我可以在查询编辑器中看到正确的表。但是当我尝试运行简单的查询时,我得到了两个错误之一:如果它是一个小文件,我得到:“错误:解析的清单不是有效的 JSON 对象......”;如果它是一个大文件,我会得到:“错误:清单太大细节:...”。我怀疑它正在寻找或相信查询中的文件是清单,但我不知道为什么或如何解决它。我已尽可能严格地遵循文档,并通过屏幕共享复制了该过程,并与同样被难住的 AWS 技术支持代表分享。

【问题讨论】:

    标签: amazon-redshift manifest aws-glue aws-glue-data-catalog amazon-redshift-spectrum


    【解决方案1】:

    发现问题:发生错误是因为我在同一个 s3 文件夹中有不止一种类型的文件(即不同布局的文件)。可能有其他方法可以解决此问题,但为给定的 s3 文件夹隔离一种类型的文件解决了问题,并允许 Redshift Spectrum 成功地对我的文件执行查询。

    【讨论】:

      猜你喜欢
      • 2019-09-20
      • 1970-01-01
      • 2021-01-12
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-12-13
      • 1970-01-01
      相关资源
      最近更新 更多