【问题标题】:Is it possible to reduce Redshift load with Presto?是否可以使用 Presto 减少 Redshift 负载?
【发布时间】:2021-12-21 11:51:00
【问题描述】:

我有相当高利用率的Redshift 集群和Prestodb 集群。 让我们假设在我的情况下无法重新调整 Redshift 集群。

为 Presto 设置 Redshift Connector 并在 Presto 而不是 Redshift 上运行一些复杂的查询是否有意义?

Presto 会将整个查询传播到 Redshift 还是只从其中加载数据(我猜是相当便宜的操作)并在 Presto 端加入和聚合它?

【问题讨论】:

  • 您为什么认为移动数据“相当便宜”?您要移动多少数据,您的带宽是多少?如果您执行频繁的查询,您最好卸载到 S3 并使用 Presto 查询这些文件。
  • 我想避免这种手动卸载,但如果 Presto(和 Redshift Connector)能为我做到这一点,那就太好了。

标签: sql amazon-web-services jdbc amazon-redshift presto


【解决方案1】:

“Redshift Connector for Presto”似乎只是调用一个 Amazon Redshift 集群。因此,它将在 Presto 和 Redshift 上产生负载。

在尝试将 Redshift 数据连接到 Presto 可访问的其他类型数据时会很有用,但它不会减少 Redshift 集群上的负载。

相反,一种选择是将数据存储在 S3 中,而不是 Redshift 集群中。然后可以将这些数据作为 Redshift 外部表 作为 Presto 表访问。这将允许您在两个系统之间“转移负载”。

【讨论】:

    猜你喜欢
    • 2019-04-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-10-13
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多