【发布时间】:2015-11-13 02:25:50
【问题描述】:
我正在使用 talend open studio 将 salesforce 数据推送到我的 redshift 数据库。通过使用以下方式推送数据:
1. tSalesforceInput
2. tMap
3. tFileOutputDelimited
4. tRedshiftOutput
我只得到大约 2-5 行/秒,这对我来说根本不起作用。
通过将分隔文件推送到 tS3Put,然后将数据推送到 redshift,传输速度会快得多,大约 500 行/秒。我继续面临的问题是我得到了错误:
AWS 身份验证需要有效的 Date 或 x-amz-date 标头(服务:Amazon S3;状态代码:403;错误代码:AccessDenied;请求 ID:CC9C86CCC65625C0
我不知道如何解决。我曾尝试在运行之前使用 tLibraryLoad 加载 joda time 2.8.2,然后再运行,但它仍然失败。非常感谢任何建议。
【问题讨论】:
-
您使用的是哪个版本?如果您要上传大于 5GB 的文件,默认 S3 组件有一些限制,但除此之外它应该可以正常工作。你确定组件参数正确吗?
-
顺便说一句,根据我的测量(使用客户端加密的 gzip 压缩数据文件),从 S3 到 redshift 的加载速度约为 20 Mbit/秒,这比您的目标 500 行/秒要好得多.
-
我正在尝试上传一个 30mb 的 .csv 文件。我尝试使用 tS3Connect 简单地测试连接,但它失败了。当我使用 tLibraryLoad 并加载 AWS JAR 文件时,它不会给我一条错误消息,但它实际上并没有做任何事情......