【发布时间】:2020-12-31 04:18:46
【问题描述】:
我在通过 Shell 命令活动让 AWS Data Pipeline 在 EC2 实例上运行时遇到问题。
我一直按照这里找到的指南一步一步来:https://medium.com/@SarwatFatimaM/data-scientists-guide-setting-up-aws-datapipeline-for-running-python-etl-scripts-using-c6c8fa4de70d
我遇到的主要问题是管道将挂在WAITING_FOR_RUNNER 状态。
我已经确认我的 python 脚本和 .bat(必须从 .sh 更改,因为我使用的是 Windows ec2)在所需的 Ec2 实例中运行。但是,据我所知,这个问题是我从 Datapipline Architect 内部收到的警告的结果:
Errors/Warnings
Object:DefaultResource1
WARNING: Could not validate S3 Access for role. Please ensure role ('DataPipelineDefaultRole') has s3:Get*, s3:List*, s3:Put* and sts:AssumeRole permissions for DataPipeline.
我已尝试编辑 IAM 角色,以便 DataPipelineDefaultRole 和 DataPipelineDefaultResourceRole 都可以访问 AmazonEc2FullAccess、AmazonS3FullAccess、AWSDataPipelineRole、AWSDataPipeline_FullAccess 策略,并尝试此处显示的建议内联策略: AWS Data Pipeline: Issue with permissions S3 Access for IAM role 在这里https://forums.aws.amazon.com/thread.jspa?threadID=241048。
我已经让这些政策搁置了几个小时,并且我已经重建了几次管道,但我仍然不断收到那个具体的警告。你有什么想法吗?
【问题讨论】:
标签: amazon-web-services amazon-ec2 aws-data-pipeline