【发布时间】:2016-07-18 18:02:30
【问题描述】:
我目前正在优化一个 SSIS 包,该包在运行时处理大约 2000 个文件并将其加载到 ETL 表中。这是一个简单的 foreach 循环,可以快速加载到 netezza 表中。显然,这需要相当多的时间,主要是因为每次加载一个文件时,在我们可以直接进入下一个文件之前,还需要执行一些其他审计步骤。我尝试使用nzload,但它并没有太大变化,因为文件的实际加载速度很快,只是 1 个文件 x 2000 的整个循环很多,这让我想到了我的问题:
有没有一种简单的方法可以将其分成 4 个流?所有文件都位于 1 个目录中(它们是 txt 文件),并以整数结尾。例如,命名约定是File1607120001,而结束数字只会增加(接下来是File1607120002,直到File1607123000,然后712 将更改为713,它会再次重置为3000)。有什么特殊的方法可以欺骗 foreach 分子并执行 4 个单独的流从同一个目录加载到同一个表吗?
【问题讨论】:
标签: visual-studio ssis netezza flat-file