【问题标题】:How to export DynamoDB table data without the point in time recovery?如何在没有时间点恢复的情况下导出 DynamoDB 表数据?
【发布时间】:2021-02-07 07:21:22
【问题描述】:

我正在尝试从 DynamoDB 表中导出过去 15 天的数据,但是 不幸的是,时间点恢复不活跃。所以我不能使用新的 DynamoDB 导出到 S3 功能,因为它不具有追溯性。

我尝试使用 AWS Data Pipeline 将 DynamoDB 数据导出到 S3 但它是否具有追溯力?

如果是这样,我尝试导出数据,但管道失败 状态为已取消的 TableBackupActivity。在日志存储桶和 数据管道控制台,但只有这个

@failureReason Resource not healthy: Jobflow retired

如何知道这是否是由于 DynamoDB 表的读取容量单位造成的?

【问题讨论】:

  • 所以你想导出你没有的数据,因为你没有启用时间点恢复?除非您启用了 DynamoDB 流并在某处持续写入更改(这似乎不太可能),否则您可能不走运:/

标签: amazon-dynamodb amazon-emr amazon-data-pipeline


【解决方案1】:

如果没有启用时间点恢复,您无法将数据本地备份到 s3。

另一种方法是读取完整的数据库并将其保存为 JSON。并且在恢复期间使用您的 JSON 文件重新填充您的灾难恢复数据库。 亚马逊有一篇文章从这里的 JSON 文件中填充 dynamodb https://aws.amazon.com/blogs/compute/creating-a-scalable-serverless-import-process-for-amazon-dynamodb/

【讨论】:

  • 我强烈建议不要使用这个答案,因为这 (a) 占用了表的读取容量(通过扫描)并因此影响性能 (b) 比需要的时间长得多
  • @Yuki 你是对的。这是一个资源非常广泛的过程。只是没有其他原生方式。
  • 您还有 aws 备份。你试过了吗?
猜你喜欢
  • 2017-05-16
  • 1970-01-01
  • 2015-09-22
  • 1970-01-01
  • 1970-01-01
  • 2011-02-17
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多