【发布时间】:2020-11-18 23:01:29
【问题描述】:
例子
相同/学生/土地/压缩文件 sameer/student/pro/未压缩文件
sameer/员工/土地/压缩文件 sameer/employee/pro/未压缩文件
在上面的示例中,我需要从存在于不同子目录中的所有 LAND 文件夹中读取文件,并需要对其进行处理并将它们放置在 PRO 文件夹中的相同子文件夹中。
为此,我使用了两个 GCS 节点,一个来自源,另一个来自接收器。
在 GCS 源中,我提供了路径 gs://sameer/ ,它从所有子文件夹中读取文件并将它们合并到一个文件中,并将其放置在接收器路径中。
除了输出,所有文件都应该放在我从中获取的子目录中。
可以通过对每个文件夹单独运行管道来实现异常输出
我希望这可以通过单个管道运行来实现
【问题讨论】: