【发布时间】:2018-01-30 09:28:15
【问题描述】:
在我的 Azure Data Lake 目录 ingest 中,我有以时间戳命名的子目录:
ingest/1510395023/file.tsv
ingest/1510425023/file.tsv
ingest/1510546210/file.tsv
...
在 Azure 数据工厂 v2 复制活动(Data Lake 到 SQL Server)中,如何过滤 Data Lake 目录到那些大于指定时间戳的目录?
假设我会将已复制的时间戳记录到 SQL Server 中,并且在下一次管道运行时,我只想根据 查找活动 复制增量新目录>.
数据工厂文档参考logical functions,但我不明白如何在这种情况下实现它们。
或者:如果对文件名(而不是目录)提供逻辑比较过滤器,那也会很有帮助。
注意:我也想加载历史数据,所以只过滤大于等于now的时间戳是不够的。
【问题讨论】:
标签: sql-server azure-data-factory azure-data-lake