【发布时间】:2020-01-29 18:34:24
【问题描述】:
我正在尝试建立可扩展的雪管基础设施。我有一个 AWS lambda 函数提取数据并将原始 json 文件放入下面的相应文件夹中。
理想情况下,我想设置雪管以将每个文件夹中的数据读入它自己的雪花表中。
例如)
- leads 文件夹中的leads json 文件现在通过管道传输到一个 雪花中的leads_json 表。
- 现在,位于机会文件夹中的机会 json 文件通过管道传输到雪花中的 opportunitie_json 表中。
如何设置管道和阶段以减少所需的管道和阶段数量?
存储桶中的每个子文件夹是否需要一个管道和阶段?
我将使用 SQS 通知来利用 AUTO_INGEST=true 功能。
【问题讨论】:
标签: snowflake-cloud-data-platform