【问题标题】:Increase & Decrease DynamoDb RCU from AWS DataPipeline从 AWS DataPipeline 增加和减少 DynamoDb RCU
【发布时间】:2019-11-20 13:57:09
【问题描述】:

我有一个写密集型的AWS DynamoDb 表。我已经使用10,000 WCU 和1000 RCU 将其配置为预置容量模式。

我正在使用AWS Datapipeline 将 DynamoDb 内容导出到 S3。管道配置读取吞吐率75%

在此设置中导出 ~150GB 的数据大约需要 ~2 hours。当我将 RCU 增加到 10,000 时,导出在不到 20 分钟内完成。

DataPipeline 中是否有任何方法可以仅在我的管道运行时增加预置的 RCU?由于此管道配置为一天仅运行一次。

【问题讨论】:

    标签: amazon-web-services amazon-dynamodb amazon-data-pipeline aws-data-pipeline


    【解决方案1】:

    您无法从数据管道作业中控制 DynamoDB 容量。

    但是,您可以将 AWS Step Functions 用于orchestrate ETL jobs 与其他任意步骤。因此,您的解决方案可能是预定的CloudWatch event that starts a Step Function

    1. 设置 DynamoDB 表的容量。 (我认为您需要为此编写一个简单的 Lambda 函数,因为 Step Functions 无法直接执行此操作。)
    2. 调用启动数据管道作业的 Lambda
    3. 等待作业完成
    4. 重置表的读取容量

    其他资源

    【讨论】:

      猜你喜欢
      • 2021-11-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2010-12-01
      • 1970-01-01
      • 2022-06-15
      相关资源
      最近更新 更多