【发布时间】:2016-03-22 11:48:13
【问题描述】:
我看到类似的问题已经存在:
Copying only new records from AWS DynamoDB to AWS Redshift
Loading data from Amazon dynamoDB to redshift
不幸的是,它们中的大多数已经过时(因为亚马逊推出了新服务)和/或有不同的答案。
就我而言,我有两个数据库(RedShift 和 DynamoDB),我必须:
- 使 RedShift 数据库保持最新
- 在 S3 上存储数据库备份
为此,我想使用该方法:
- 仅备份新的/修改的记录 一天结束时从 DynamoDB 到 S3。 (每天 1 个文件)
- 使用 S3 中的文件更新 RedShift 数据库
所以我的问题是最有效的方法是什么?
我阅读了this tutorial,但我不确定 AWS Data Pipeline 是否可以配置为仅“捕获”来自 DynamoDB 的新记录。如果无法做到这一点,则不能每次都扫描整个数据库。
提前谢谢你!
【问题讨论】:
标签: amazon-web-services amazon-s3 amazon-dynamodb amazon-redshift amazon-data-pipeline