【发布时间】:2017-02-26 22:26:50
【问题描述】:
我正在尝试创建一个作业来连接来自 aws 服务的 sftp 服务器,以将文件带入 aws 中的 s3 存储。这将是一项每天晚上运行并将数据带入 S3 的自动化作业。我已经看到有关如何手动连接 aws 并将数据导入 S3 的文档。但是,我没有发现任何关于连接外部 SFTP 服务器以将数据带入 S3 的信息。不知道是否可行?
【问题讨论】:
-
S3 不接受直接连接——至少我从未听说过。由于无法生成 ssh 密钥对,因此无法使用 sftp 或 ssh 登录。此外,它可能是一个集群,而不是服务器。我相信以编程方式与 S3 存储桶交互的唯一方法是使用他们的 SDK。
-
使用简单的 C# 控制台应用程序,您可以轻松地从 FTP 服务器(FTPS、SFTP)读取文件并将其上传到 S3。
-
我没有提到文件的内容。它们都是 zip 文件,并且可能使此过程自动化的唯一方法是利用 SDK 库。有没有办法安排工作并定期进行。使用我的 java 或 C# 代码在 AWS 中自动执行此过程的工作。最终这些文件将被加载到 hdfs 中。
-
如果你在windows机器上部署你的代码,你可以使用任务调度器。
-
嘿@Mahdi,感谢您的建议。现在我们使用 SQL Server Int.Service 包来执行此过程但是我的目标是将此过程完全移动到云中并且我希望最少的交互,更糟糕的情况是我将使用 SSIS 从 sftp 中提取数据并将文件解压缩到本地文件服务器然后上传这些文件到 s3。
标签: amazon-web-services amazon-s3 sftp amazon-redshift emr