【发布时间】:2016-05-18 20:43:26
【问题描述】:
由于 Amazon Redshift 针对读取而不是写入进行了优化,我如何使用 ETL 工具(在我的情况下为 Pentaho 数据集成)管理渐变维度过程?
由于 ETL 工具会逐行进行更新/插入(维度查找/更新),因此性能会非常低。
有人遇到过这个问题吗?
【问题讨论】:
-
实际更改/插入的维度行的百分比是多少?如果百分比很小(Dimension Lookup/Update 步骤可能没问题。
标签: pentaho amazon-redshift data-integration scd