【发布时间】:2021-03-18 10:08:21
【问题描述】:
我是 Azure 数据工厂的新手,我正在尝试解决一个特定的用例。我必须将文件从源文件夹复制到目标文件夹,这两个文件夹都在同一个存储帐户中。源文件夹中的文件格式不同(csv、txt、xml),并在末尾附加日期,例如:addresses_2020-11-01.csv(日期格式:yyyy-mm-dd)
我必须创建一个管道,将文件排序并存储在此层次结构中的动态文件夹中:例如:csv->yyyy->mm->dd。我的理解是首先我必须将文件过滤成不同的格式,然后使用 split 函数将有 _ 的子字符串拆分,然后根据文件名中的年月日动态创建文件夹。下面是我到目前为止创建的管道的屏幕截图:我无法显示屏幕截图,但链接会打开屏幕截图。
[管道过滤文件,并复制到目标文件夹]
我做了什么:
- 使用 Get Metadata 提取子项
- 将 Get Metadata 的输出过滤到 csv、txt 和 xml 文件中
- 用于包含复制活动的每个活动。由于通配符包含 *.txt、*.csv、*.xml ,因此此活动将过滤活动中的文件复制到相应的文件夹(csv、txt..)中
我不确定在过滤文件后前进的正确方法是什么,以便根据文件名中的日期创建动态文件夹。我想我需要将 set Variable 活动与复制活动一起使用,但不知道如何实现这一点。任何帮助将不胜感激。
谢谢!!
【问题讨论】:
标签: azure-data-factory azure-data-factory-pipeline