【发布时间】:2021-11-05 03:14:13
【问题描述】:
当我使用 Distcp 工具通过不同的集群复制文件时,我发现了一些不寻常的文件,后缀为__distcpSplit__。这是什么?原始文件没有这样的后缀。我也注意到源文件被其他进程打开了,但是为什么会出现这个结果?
【问题讨论】:
-
准确来说,名字是 ****.__distcpSplit__0.20210101
当我使用 Distcp 工具通过不同的集群复制文件时,我发现了一些不寻常的文件,后缀为__distcpSplit__。这是什么?原始文件没有这样的后缀。我也注意到源文件被其他进程打开了,但是为什么会出现这个结果?
【问题讨论】:
如果你传递arg blocksPerChunk > 0,它会将大文件分成多个块,每个块的大小为blockSize * blocksPerChunk,当distcp完成时,输出提交器会将这些文件连接到提交阶段的最终目标文件。
【讨论】: