【发布时间】:2014-05-21 17:39:22
【问题描述】:
有谁知道从 Amazon S3 到 Redshift 的复制速度有多快?
我只想每天使用大约一个小时的 RedShift 来更新 Tabelau 报告。正在运行的查询始终在同一个数据库中,但我需要每晚运行它们以考虑当天的新数据。
我不想让集群 24x7 每天运行一小时,但我能看到的唯一方法是每晚将整个数据库导入 Redshift(我不认为您不能暂停或暂停集群)。我不知道复制速度是多少,所以我不知道每晚将 10GB 文件复制到 Redshift 是否会相对较快。
假设可行,我的想法是将 SQL Server dbase 上的增量更改推送到 S3。使用 Cloud Formation,我在凌晨 1 点自动配置 Redshift 集群 1 小时,从 S3 导入 dbase,并安排 Tableau 在此期间运行查询并获得结果。我密切关注查询需要多长时间,如果需要超过一个小时,我只需修改云的形成。
通过这种方式,我希望通过将所有 ETL 外包给 Redshift,并且只购买我在 Redshift 上使用的东西,从而保持一个真正“精简”的 Tableau 服务器。
请随时批评我的解决方案,或者直接将其从水中吹出来。否则,如果答案的共识是导入速度相对较快,那么我会竖起大拇指,我正朝着这个解决方案的正确方向前进。
感谢您的帮助!
【问题讨论】:
标签: amazon-web-services amazon-s3 amazon-redshift