【问题标题】:Securely transferring data from HDFS to amazon S3 using distcp使用 distcp 将数据从 HDFS 安全地传输到 amazon S3
【发布时间】:2015-04-07 04:27:20
【问题描述】:

我们希望将 Cloudera Hadoop 集群中的 HDFS 数据备份到 Amazon S3。看起来我们可以为此使用 distcp,但不清楚的是数据是否通过加密传输复制到 S3。

是否需要进行配置才能启用此功能?

【问题讨论】:

标签: hadoop ssl amazon-s3 distcp


【解决方案1】:

我认为 Hadoop 中尚不支持 S3 客户端加密。

似乎S3 server side encryption(在 S3 端加密静态数据)可以从 Hadoop 2.5.0 配置。

要启用它,请在core-site.xml 中添加以下属性:

<property>
  <name>fs.s3n.server-side-encryption-algorithm</name>
  <value> AES256 </value>
  <description>
    Specify a server-side encryption algorithm for S3.
    The default is NULL, and the only other currently allowable value is AES256.
  </description>
</property>

有关 S3 服务器端加密的更多信息Hadoop-10568

【讨论】:

  • 感谢您的回复 - 我正在寻找的是如何确保数据在传输过程中被加密。换句话说,distcp 是否通过 SSL/TLS 将数据传输到 Amazon S3
  • 据我所知,传输中的加密默认情况下有效。我通过在我的存储桶上放置一个策略来测试这一点,该策略在 securetransport=false 时阻止 putobject。如果未启用安全传输,则 distcp 命令将失败并出现 403 错误,所以我相信这是可行的
  • 我认为属性名称是fs.s3a.server-side-encryption-algorithm
猜你喜欢
  • 2015-04-08
  • 1970-01-01
  • 2020-12-22
  • 2018-02-27
  • 2014-11-13
  • 1970-01-01
  • 1970-01-01
  • 2017-07-04
  • 1970-01-01
相关资源
最近更新 更多