数据仓库|阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对

数据仓库|阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对

文章图片

数据仓库|阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对

文章图片

数据仓库|阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对

文章图片

数据仓库|阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对

我对一些当下较为热门的概念做了一些梳理 , 其实想要了解区别 , 我觉得得先知道它们各自的定义 。
1、先说数据中台它的起源我就不说了 , 相信大家或多或少都看过这个有趣的故事:15年马云携高管访问supercell这个游戏公司 , 这个游戏公司为什么牛逼?就是因为它的员工不多 , 但是却造出了很多知名的游戏 , 原因就在于它的中台战略深入人心 , 如何像他们一样提高人效?这才是高管们关心的 。
回到国内 , 中台的概念就被造出来了 , 从起名可以看出来 , 是处于中间位置 , 连接前后的作用 , 最终的目的是提高员工和企业的效率 。
阿里事业部不下十几个 , 淘宝、天猫、 1688、聚划算、菜鸟物流 , 每个事业部都有独立的架构体系 , 对应各个的开发和运维 , 这会出现功能重复建设 , 数据格式不统一 , 口径不一致 。
中台的出现就是为了解决这些重复造轮子的情况 , 打通各个业务系统的数据 , 有些费时费力的代码 , 写过一遍了 , 为什么还要再写呢?此处@各研发 。
再拿某公司来说 , 很多人都觉得它是app工厂 , 造出了很多知名的产品如X音、X条等 , 但是他们的研发背后 , 肯定有一套 , 和阿里一样的 , 合理的数据中台体系 。

我想提一下数据中台的价值之一:数据服务化
数据中台要能打通烟囱式的数据体系 , 避免重复开发 , 做到全域数据打通 , 构建公司级统一的数据仓库 。 同时 , 也提供更方便的数据访问方式:比如数据API、可视化访问、自助提取等 。
说到可视化 , 就不得不提一下企业的数据架构了:

可视化一般是处于展示层或者应用层 , 你可以没有中台 , 但是你不能没有可视化 , 因为中台是为了研发方便 , 但是可视化就是为了老板和管理层的决策了 , 谁重要?
市面上有相当多的可视化工具 , 成熟的也好 , 开源的也罢 , 很多很多 , 但这些大多是门槛挺高的工具 , 比如Echarts、Highchart等 , 或许它们在技术层面上很厉害 , 也很成熟 , 但是缺点也很明显:人群太少 , 只有懂技术的能用 。
我做可视化也有点经验 , 这么几个是比较实用的:
(1)FineReport
国内的一款报表工具 , 如果要论稳定性、适用性、决策性 , 它可谓是当仁不让 , 虽然定位是解决IT重复开发、企业数据孤岛的报表工具 , 但是还能做可视化大屏 , 你能想象吗?

(2)FineBI
国内BI的前者 , 并且已经在这个位置上很多年了 。
简洁明了的数据分析工具 , 也是我个人最喜欢的可视化工具 , 零代码零代码!!!

可视化的场景都在这里了 。
(3)Tableau
【数据仓库|阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对】
国外的工具 , BI领域的第一 , 但是论价钱的话....很多企业都会放弃的 , 而且就我认识的人来看 , 有很多用了Tableau然后放弃的 , 最终回到了国产BI , 只能说各有选择吧 。
2、再来说说数据仓库在我看来 , 数据仓库就是用来进行数据分析的 , 因为企业数据量大到一定程度之后 , 说明该企业的规模也是非常大的 , 数据库在进行大量数据查询的时候效率较低 。
如果每次分析都从数据库里取数 , 那么会非常麻烦 , 所以就有了数据仓库 , 每隔一段时间把数据库里面的所有数据放到数据仓库里分析 。
数据仓库整合多个数据源 , 进行多维的分析 , 其架构一共有4层:

3、两者的区别先对两者的概念进行一个简单的总结:

  • 数据仓库是利用数据平台提供的计算和存储能力 , 在一套方法论指导下建设的一整套的数据表
  • 数据中台包含了数据平台和数据仓库的所有内容 , 将其打包 , 并且以更优雅以及更产品化的方式对外提供服务和价值
然后你就会发现:数据中台其实包含数据仓库 , 数据中台可以将企业数据仓库建设的投入价值进行最大化 。 再来扩大一点 , 说说和BI的关系吧 , 数据仓库是BI的基石 , 数据仓库为BI系统提供良好的数据基础 。
数据仓库的主要场景是支持管理决策和业务分析 , 而数据中台则是将数据服务化之后提供给业务系统 , 目标是将数据能力渗透到各个业务环节 , 不限于决策分析类场景 。

数据中台也可以将已建好的数据仓库当成数据源 , 对接已有数据建设成果 , 避免重复建设 。 当然也可以基于数据中台提供的能力 , 通过汇聚、加工、治理各类数据源 , 构建全新的离线或实时数据仓库 。
不过数据中台更加偏重于数据使用 , 较之于传统数据仓库的数据组织形式 , 数据中台的数据覆盖范围更广、数据关系和处理模式更复杂、数据使用方式更灵活 , 因而给企业内部数据使用人员的能力带来较大挑战 。


    推荐阅读