【问题标题】:using azure data factory to unzip multiple files from http site使用 azure 数据工厂从 http 站点解压缩多个文件
【发布时间】:2019-04-30 16:04:41
【问题描述】:

我在我的 ADF 中设置了一个“http 文件”数据源以连接到一个特定的 URL (https://www.sos.wa.gov/_assets/corps/txtCorpsData.zip),该 URL 指向一个包含 4 个单独的 .txt 文件的 ZIP 文件。

服务成功连接并解压缩文件,但它只读取 ZIP 存档中的第一个文件。如何将源分成 4 个不同的单独源?我猜我需要使用一些参数,但不确定是什么。

以下是连接详细信息的屏幕截图: connection detail

【问题讨论】:

    标签: azure zip unzip azure-data-factory azure-data-factory-2


    【解决方案1】:

    我想我明白了,有点: 使用指向“Http 文件”作为源的“复制数据”任务。 然后,该“Http 文件”源将我的问题中的 url 视为链接服务,该源也会压缩 ZIP。 在“复制数据”任务中,接收器是一个 blob 连接。

    当我运行此任务时,它会将 ZIP 文件压缩到 blob 连接路径下的新文件夹中。这提出了我现在正在处理的一个新问题,即新文件夹的创建似乎与运行管道的 GUID 一样,不知何故,我需要找出一种方法来指定文件夹名称以使其保持一致。 .我可能会在稍后发布另一个问题。

    【讨论】:

      【解决方案2】:

      在接收器设置中将复制行为设置为无,这样就可以保留文件名

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2020-06-27
        • 1970-01-01
        • 1970-01-01
        • 2022-11-11
        • 2021-01-16
        • 2018-09-26
        • 2019-12-07
        • 1970-01-01
        相关资源
        最近更新 更多