【发布时间】:2021-06-26 09:15:39
【问题描述】:
我在 Azure Blob 存储中有以下文件夹结构:
container/
dataset1/
2021-01-01/
file_01.parquet
file_02.parquet
2021-01-02/
file_01.parquet
file_02.parquet
file_03.parquet
dataset2/
2021-01-01/
file_01.parquet
2021-01-02/
file_01.parquet
file_02.parquet
.
.
. etc...
我有每个数据集文件夹的管道。管道迭代“日期”文件夹中的文件,处理它们并将结果输出到其他地方。每个管道都有如下定义的输入数据集路径:container/dataset/。这工作正常。当我触发管道时,它会遍历所有文件。
现在我想自动化管道,以便在将新数据添加到数据集文件夹时触发它(它始终位于名称中带有日期的文件夹中)。我想我可以使用存储事件触发器来做到这一点,但它是为每个“日期”文件夹运行管道还是只在添加的文件夹上运行?
【问题讨论】:
-
嘿@kilipukki,以下答案是否解决了您的疑问?
标签: azure azure-data-factory azure-blob-storage