【发布时间】:2018-11-04 19:03:17
【问题描述】:
我在网上学习什么是事实表和维度表,所以建议用真实的数据集来练习。作为示例,我下载了这个 excel 文件。
我想试试星型模式,据我了解可以分为多个事实表,但是每个表都不一样,是不是已经是事实表了,不能分维度? 对于学分,我从这里获得了数据集https://www.kaggle.com/zynicide/wine-reviews
【问题讨论】:
我在网上学习什么是事实表和维度表,所以建议用真实的数据集来练习。作为示例,我下载了这个 excel 文件。
我想试试星型模式,据我了解可以分为多个事实表,但是每个表都不一样,是不是已经是事实表了,不能分维度? 对于学分,我从这里获得了数据集https://www.kaggle.com/zynicide/wine-reviews
【问题讨论】:
典型的机器学习数据由测量或事件组成,可以解释为单个事实表。
数字属性(如price或points)是事实表的测量属性。
因素(或时间)属性(例如country、province 或tester_name)是外键 维度表。
维度不包含在您的数据中,但可以使用 distinct 键隐式重构。
【讨论】: