【发布时间】:2021-01-27 05:45:40
【问题描述】:
情况是这样的,在源数据库中,一个维度有超过 600K 的活动行,但实际上业务只使用了其中的 100 个。
很遗憾,他们可能使用的值列表未知,我们无法手动过滤这些值以填充维度表。
我在想,如果我在事实表中包含该表的维度列,然后当我们将其发送到暂存区时,只需将其与事实分开并将其发送到它自己的表。
这样,我只会捕获实际使用的值。
附:他们在应用程序中具有搜索功能,可帮助用户浏览 600K 值。它不像是一个下拉字段!
你有更好的推荐吗?
【问题讨论】:
-
维度表不需要定期更新。您能描述一下为什么您的维度表必须定期更新吗? 600K 行不算太大。
-
嗯,你是对的...它不必定期更新...一周或两周一次就足够了...问题是将其加载到 BI (Qlikview) . 600K 对于 Qlikview 中的维度表来说太大了。会减慢一切
标签: data-warehouse snowflake-schema