【发布时间】:2021-08-21 11:52:55
【问题描述】:
尝试将数据从 Teradata 移动到 Snowflake。已经创建了一个进程来为每个表运行 TPT 脚本来为每个表生成文件。
在雪花中运行 COPY INTO 时,文件也被拆分以实现并发。
需要了解将这些文件从 On Prem Linux 计算机移动到 Azure ADLS 的最佳方式。考虑 TB 大小的文件。
Azure 是否提供任何机制来移动这些文件,或者我们可以直接从 Teradata 在 ADLS 上创建文件吗?
【问题讨论】:
-
Considering files in Terabyte size.Snowflake 建议使用 100-250 MB 的文件,并建议使用大于 100 GB 的文件。这有助于并行文件加载。 -
您从 Teradata csv / other 导出什么文件格式?看到这个帖子:stackoverflow.com/questions/50062474/…
标签: azure teradata snowflake-cloud-data-platform