【问题标题】:AWS Glue S3 VPC Endpoint Policy IssueAWS Glue S3 VPC 终端节点策略问题
【发布时间】:2018-02-07 19:12:52
【问题描述】:

当我为 AWS Glue 服务创建 S3 VPC 终端节点以从 redshift 集群卸载数据时,ETL 作业仅在 VPC 终端节点策略设置为“完全访问”时才有效。

 {
    "Statement": [
        {
            "Action": "*",
            "Effect": "Allow",
            "Resource": "*",
            "Principal": "*"
        }
    ]
}

当策略设置为“自定义”并修改如下时,它不起作用。

{
    "Statement": [
        {
            "Action": "*",
            "Effect": "Allow",
            "Resource": ["arn:aws:s3:::examplebucket",
                   "arn:aws:s3:::examplebucket/*"],
            "Principal": "*"
        }
    ]
}

在 ETL 作业中,我已将 examplebucket 指定为保存 ETL 脚本和临时文件的位置,因此我很难理解为什么仅当策略设置为自定义时 ETL 作业才会失败。 Glue 是否尝试访问作业中指定存储桶以外的其他 S3 资源?

【问题讨论】:

  • 这是一个很好的问题,你终于想通了吗?谢谢

标签: amazon-web-services amazon-s3 amazon-ec2 aws-glue


【解决方案1】:

胶水作业还需要以下内容: 1. S3中的临时目录。 2. S3中存放生成的python脚本的位置。

例如,如果没有指定脚本位置;胶水自动选择以下位置“s3://aws-glue-scripts-YourAccountId-us-east-1/”

确保您的 IAM 角色策略也反映了您选择的 s3 位置。

【讨论】:

    猜你喜欢
    • 2022-01-09
    • 2020-05-21
    • 2021-02-22
    • 2017-07-27
    • 2021-11-25
    • 2019-08-12
    • 2020-02-07
    • 2020-03-03
    • 2021-05-15
    相关资源
    最近更新 更多