【发布时间】:2020-03-14 01:10:43
【问题描述】:
我希望有人经历过相同的过程并可以帮助我看看以下情况是否可行。
我目前构建了一个从 S3 存储桶复制的管道。该存储桶包含大量文件夹。 Azure 数据工厂是否有办法在从 S3 存储桶复制数据时忽略文件夹而只复制文件本身?我已经读到 COPY 活动具有“扁平层次结构”,但我看到的最大限制是所有文件都被重命名,我不确定这些文件是否是这些文件夹中包含的所有文件,因为它提到它仅“在目标文件夹的第一级”。
另一个问题是 S3 存储桶有嵌套文件夹(例如:“domain/yyyy/mm/dd/file”),有些文件夹包含数据,有些则不包含。唯一的优点是所有这些文件都包含相同的架构。
此管道的最终结果如下:
1) 从 S3 存储桶复制文件而不复制文件夹结构 2) 将文件加载到 Azure 数据库中
如果有人使用 Azure 数据工厂或其他工具做过类似的事情,我将非常感谢您的见解。
【问题讨论】: