一.数据仓库的基本概念

  • 数据仓库: 数据仓库通常是一种面向主题的,集成的,随时间变化的,但是信息本身是相对稳定的数据集合,它主要用于对管理决策过程的支持
  • 主题: 是指用户使用数据仓库进行决策时所关心的重点方面,如:收入,客户,营销渠道等; 所谓面向主题,是指数据仓库内的信息是按主题进行组织的,而不是像业务支持系统那样是按照业务功能进行组织的
  • 集成: 是指数据仓库中心的信息不是从各个业务系统中简单的抽取出来的,而是经过一系列的加工,整理和汇总的过程,因此数据仓库中的信息是关于整个企业的一致的全局信息
  • 随时间变化: 是指数据仓库内的信息并不只是反映企业当前的状态,而是记录了从过去某一时间点到当前各个阶段的信息.通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测

二.数据仓库的特点

  • 效率足够高: 数据仓库的分析数据一般分为日,周,月,季,年等,可以看出,日为周期的数据要求的效率最高,要求24小时甚至12小时内,目前普遍的数据展示方式为T+1,即当日处理昨日的业务数据
  • 数据质量: 基于数据仓库的应用所面对的一般为企业决策层用户,所以对数据仓库提供各种信息,肯定要准确的数据;但由于数据源有脏数据或者代码不严谨,所以数据仓库流程通常分为多个步骤,包括数据抽取,清洗,转换,装载,查询,展现等等;其中数据清洗则主要对抽取过来各数据源的脏数据和不规范数据进行统一标准化。
  • 扩展性 : 有的大型数据仓库系统架构设计复杂,是因为考虑到了未来3-5年的扩展性,这样的话,未来不用花太多时间去重建数据仓库系统,就能很稳定运行。主要体现在数据建模的合理性,数据仓库方案中多出一些中间层,使海量数据流有足够的缓冲,不至于因为数据源的变动而导致用户应用功能的频繁变动。

ODSB模型架构图

ODSB数据仓库

  • 根据ODSB及管理分析类应用项目的实施特点,以及在ODSB建设过程中的经验和成果,将其项目实施过程分为8个阶段,分别是:
    ODSB数据仓库

  • 重点是对需求分析阶段,模型设计阶段,ETL开发阶段,前端展现开发阶段的实施工艺流程做重点介绍

需求分析阶段

  • 展现分析
    -> 根据收集的业务需求,进行展现层面的分析,并进行展现形式的分类

例如:划分为明细数据查询类报表需求,分析报表需求,复杂报表需求等,对应用的功能性和非功能性需求进行分析,根据报表的展现方式分析报表的业务角度和度量

  • 数据源分析
    ->对展现的报表,查询等数据需求进行数据来源和加工业务口径方面分析

区分可从源系统(包括ODSB数据模型和分行特色系统)采集的数据和源系统中无法采集,需外部录入的数据

  • 需求分类/整理
    -> 从技术层面和业务层面上对需求进行分类/整理工作

在技术层面,结合展现分析和数据源分析成果,对业务需求从其数据源头(数据源)、中间加工过程(业务加工口径)、到实现目标(展现功能性需求与非功能性需求)进行综合整理;在业务层面,进行需求的整体规划,划分需求模块,必要的时候能用DEMO(示范)的方式与需求提成部门确认需求。

  • 需求评审
    -> 在完成需求分类/整理任务后,需求分析说明书完稿,由项目发起部门召集相关业务部门联系人,召开需求评审会议。

分类:

技术点:

相关文章: