【发布时间】:2019-11-26 04:47:49
【问题描述】:
我想将数据从我的本地本地 HDFS 服务器移动到我的 Azure HDinsight 集群。
我尝试了 distcp 命令,但它不理解数据湖存储路径。
【问题讨论】:
标签: azure hortonworks-data-platform azure-data-lake azure-hdinsight hdp
我想将数据从我的本地本地 HDFS 服务器移动到我的 Azure HDinsight 集群。
我尝试了 distcp 命令,但它不理解数据湖存储路径。
【问题讨论】:
标签: azure hortonworks-data-platform azure-data-lake azure-hdinsight hdp
将本地 Hadoop 连接到 ADLS 的步骤:
第 1 步:创建 Azure Data Lake Store 帐户。
第 2 步:创建身份以访问 Azure Data Lake Store。
第 3 步:修改您的本地 Hadoop 集群中的 core-site.xml。
第 4 步:测试从本地 Hadoop 到 Azure Data Lake Store 的连接。
第 5 步:使用 DistCp 将数据从本地 Hadoop 传输到 Azure Data Lake Store。
语法: hadoop distcp <HDFS_Path> <ADLS_PATH>
示例:hadoop distcp README.txt adl://mydatalakename.azuredatakestore.net/
更多详情请参考“Connecting On-premise Hadoop to Azure Data Lake Store”和Migrate on-premise Apache Hadoop cluster to Azure HDInsight - data migration best practices。
希望这会有所帮助。
【讨论】: