【问题标题】:Low cardinality Dimensions in Datawarehouse数据仓库中的低基数维度
【发布时间】:2014-11-26 05:06:19
【问题描述】:

我的事实表中有很多列的基数非常低 (~8)。这些列中的每一个都存储引用主表的键。我想知道是将这些单独的主表中的每一个作为维度导入还是将值直接存储在事实表中。除了我要存储的值之外,主表没有其他属性。每种方法的优缺点是什么?

【问题讨论】:

    标签: data-warehouse dimensional-modeling


    【解决方案1】:

    这似乎是一个典型的垃圾维度示例,它将许多杂项、低基数标志和指标组合在一起(而不是将它们中的每一个放在单独的维度表中)。

    其他方法的缺点:

    • 将每个低基数属性放在一个单独的专用维度中可能会导致模型过于复杂且维度表数量过多 (centipede fact tables)。
    • 允许将属性直接存储在事实表中,但仅保留给degenerate dimensions,即订单或发票编号、零售销售点交易编号等值 - 高基数值有任何描述它们的附加属性。
      低基数标志不是 DD,因为即使它们现在可能包含一个唯一键,它们将来也可能很容易具有其他属性,例如报告的多个描述性标题 - 移动用户短,桌面用户长。

    详情:Design Tip #113 Creating, Using, and Maintaining Junk Dimensions

    【讨论】:

    • 谢谢马雷克。我使用相同的想法实现它。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2023-03-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多