【发布时间】:2022-08-10 18:56:55
【问题描述】:
在这里寻找有关 Azure 基础架构设置的想法。
我的公司有本地 Hadoop 集群和 Azure Data Lake,我们使用 http 代理或 VPN 进行连接(还没有 ExpressRoute)
我们有一个 ETL 应用程序(python、spark),它使用 SPN 将数据从 HDFS 传输到 ADLS——python SDK 用于从 login.microsoftonline.com(通过代理)获取凭据,然后用于 Spark 将文件写入 ADLS gen2通过私有端点。
现在我们想使用 hdfs cli (hdfs dfs -cp hdfs://file abfs://file .
我们发现它在使用 Aceess 密钥并且连接正在通过代理(=公共 ADLS 端点)时工作
尝试通过可从本地集群访问的私有端点访问 ADLS 时,它不起作用 -因为不使用代理我们无法连接到 login.microsoftonline.com.但是一旦设置了代理,我们就只能通过公共 ADLS 端点上传数据。
你知道什么可以帮助我解决这个问题吗?
我唯一想到的就是创建指向互联网地址的内部 DNS 记录
标签: azure azure-active-directory azure-data-lake