【问题标题】:Business Intelligence [closed]商业智能[关闭]
【发布时间】:2017-03-08 00:11:13
【问题描述】:
我需要对 BI 架构进行一些说明。据我了解,第一步是从不同的数据源收集数据,清洗,通过ETL加载到数据仓库。数据仓库的Data Schema不应该是关系型的,应该支持快速的业务操作(例如Star Schema),最后我们有一些报告工具,如qlick、Tableau ...等。我的问题是,什么是 OLAP,它是在哪一步出现的?
谢谢,
【问题讨论】:
标签:
data-warehouse
business-intelligence
olap
【解决方案1】:
OLAP = 在线分析处理,通常表示“立方体”,通常是关于各种摘要的报告
这与 OLTP = 在线事务处理形成对比,后者通常是指一个系统(通常存储在关系数据库中),在详细级别进行大量读写
立方体向用户表示事物作为事实和维度。
数据仓库星型模式也将事物表示为事实和维度。在数据仓库星型模式中(是关系但未规范化),这些存储在表中
要从星型模式中获取“总计”,您需要编写一个针对数据库运行的 SQL 查询,并将所有详细级别的数据添加到总计中。有时这需要时间
要从多维数据集 (OLAP) 中获取“总计”,您可以拖放所需的维度和度量(您通常使用客户端工具来分析多维数据集),因为多维数据集通常是针对摘要进行了优化,(即它通常预先保存了摘要,并且存储机制针对生成摘要进行了优化)
多维数据集通常是从星型架构构建的,但并非必须如此 - 如果是的话,它只会让构建它变得更容易
仓库中的数据模型不代表 Olap 多维数据集(例如星型模式)吗?
是的,它们是有代表性的,但它们是不同的东西。一种将数据存储在数据库中。一个将数据存储在一个多维数据集中。多维数据集通常从数据加载,通常从数据库加载。