文章目录
中台导读
数据中台火的十分突然,似乎年前还在炒概念,年后突然就冒出来各种中台的实践。当然其中有跟风的因素,但根本原因在于,“数据”的价值正在越来越受到企业的重视,数据正在成为企业最核心以及最重要的生产资料,成为决定企业业务转型的关键因素。企业需要一个源源不断的输出数据服务,数据洞察的能力源泉,数据中台的出现就成了顺理成章的事情
大型企业才是中台的主要用户人群。这类企业本身一般来说规模和体量相对比较大,业务相对比较复杂,以前IT系统建设也比较多,目前开始从原有传统行业转到在线业务行业,甚至做线上下结合的场景,这就到了数字化转型的时机,因此中台部门会起到比较大的作用,会打通原有很多业务系统的壁垒,融合各个不同业务系统产生的数据,通过数字化的运营和驱动促使业务敏捷迭代,从而发挥更大的价值。
什么是好的中台
中台落地的根本促因之一是规避企业系统的烟囱化问题。有了中台之后,企业第一步做的是把系统拉平,建立中台平台型的组织来支撑企业内数个系统里共性的技术或是数据或是业务,比如数据中台,就是把数据全部汇聚到这个平台组织上。企业中组织的方式,一般是按照面向业务过程的数据组织方式
从存储角度来看,数据就是一张张独立的表结构,如常用的会员表,订单表等,但表与表之间无法在数据层面直接连接打通,而是需要通过外在的辅助工具,例如字典表、元数据系统等,才能进行数据梳理与逻辑分析。所以这种形式只实现了数据存储上的物理集中,而不是真正的数据层面的逻辑集中。这种数据组织形式,更多适用于统计分析等较为简单的计算场景。这样建设的中台只是起到了整合及存储作用,自身并不智能
业务而生 + 人机协同
DataAPI是数据中台的核心,是能让数据中台真正发挥价值的关键,是未来企业实现人机协同的关键,在明略科技看来,将知识图谱引入到数据中台体系内重要原因之一就是可以让DataAPI真正为了“业务而生”。
当我们将知识图谱引入到数据中台后,实现了面向业务领域的数据组织方式。明略科技通过知识图谱技术,将知识图谱融入在中台数据模型这一层,用包含概念、实体、关系、事件、标签、指标的知识图谱统一视图来定义面向领域的数据模型,并将所有隐性的语义,全部以显性的形式放到知识图谱里进行呈现,将领域知识图谱作为数据中台的数据底座,从而实现面向业务领域数据组织方式的转变。基于图挖、机器学习技术来实现隐性关联关系挖掘,并以此来满足图谱节点相似度测算、节点重要性测算、关系图中的频繁模式子图、多节点子图挖掘、社区发现、两两关联、聚类等业务需求,这些复杂计算和挖掘场景,是传统数仓模式无法支持的。
知识图谱与数据中台
下一代数据中台最核心的技术是知识图谱,因为它可以实现探索式的分析。数据的结构有链表、二位表、栈、队列、堆、数,最复杂的其实就是图,因为在海量信息中,图连接了任意两个点之间的关系。Excel 表只有横竖,所有的数据分析只能按行或者按列。而知识图谱可以给数据库带来的革命,是任何两个数据节点之间都可以建立关系,当把这个关系建立好以后就有机会按照这个维度来进行分析、关联、探索,这就像人的大脑一样。
人的大脑里没有“行”和“列”,只有“图”。所以当你用大脑计算逻辑思考这个世界时会发现,你可以探索发现很多东西,这就是为什么人类可以做创造,而如今机器人都很难做到创造的原因,因为人类可以探索、发现,找到一些你从来没有想到的东西,通过“图”的数据结构不停延展。未来后台的数据中台,可以把“头脑风暴”得到的想法连成知识图谱。上一代数据中台不做知识图谱,原因很简单,因为太贵了,原来把任何两个数据连上,数据量就已经很大,计算成本高昂。但是,幸运的是未来人类的计算机存储的成本会越来越低,存储量越来越大、计算速度越来越快。
未来一定是不断地消耗计算机的时间和空间来节省人类的时间,所以知识图谱最终一定会替代上一代数据平台的存储。未来,所有的数据并不是以矩阵结构、立方体的结构来存储,而是图状结构。人平时思考多,用的时候就可以更快,这就是知识图谱本质的原理。每一个行业的每一个数据中台,将来都应该这样做存储。
此外,企业打造了数据中台,也一定要有业务中台,否则数据中台就是个“空架子”,没有可以服务的对象。从数据中台到业务中台,无论是架构、技术接口还是逻辑,都能够通过行业知识图谱这样统一的数据和业务语言进行无缝链接,实现对上层业务更加强有力的支撑。2020年是数据中台元年,接下来,明略科技的新一代数据中台建设将贯穿更多业务场景,让数据服务于业务决策,实现数据到智慧的转换,挖掘智能时代的新机会,最终实现人机同行的美好未来。