OLAP 和 OLTP组成差别对比内容操作型数据库(OLTP)分析型数据库(OLAP)数据时间范围差别只会存放一定天数的数据存放的则是数年内的数据数据细节层次差别存放的主要是细节数据 也有汇总需求,但汇总数据本身不存储而只存储其生成公式 。这是因为操作型数据是动态变化的,因此汇总数据会在每次查询时动态生成 。存放的既有细节数据,又有汇总数据,对于用户来说,重点关注的是汇总数据部分 。因为汇总数据比较稳定不会发生改变,而且其计算量也比较大(因为时间跨度大),因此它的汇总数据可考虑事先计算好,以避免重复计算 。数据时间表示差别通常反映的是现实世界的当前状态既有当前状态,还有过去各时刻的快照 。可以综合所有快照对各个历史阶段进行统计分析
OLAP 和 OLTP技术差别对比内容操作型数据库(OLTP)分析型数据库(OLAP)数据更新差别允许用户进行增,删,改,查规范是只能进行查询数据冗余差别减少数据冗余,避免更新异常没有更新操作 。因此,减少数据冗余也就没那么重要了
OLAP 和 OLTP功能差别对比内容操作型数据库(OLTP)分析型数据库(OLAP)数据读者差别使用者是业务环境内的各个角色,如用户,商家,进货商等只被少量用户(高级管理者)用来做综合性决策数据定位差别是为了支撑具体业务创建的,因此也被称为"面向应用型数据库"是针对各特定业务主题域的分析任务创建的,因此也被称为"面向主题型数据库"
OLAP典型架构OLAP有多种实现方法,根据存储数据的方式不同可以分为ROLAP、MOLAP、HOLAP
名称描述细节数据存储位置聚合后的数据存储位置ROLAP(Relational OLAP)基于关系数据库的OLAP实现关系型数据库关系型数据库MOLAP(Multidimensional OLAP)基于多维数据组织的OLAP实现数据立方体数据立方体HOLAP(Hybrid OLAP)基于混合数据组织的OLAP实现关系型数据库数据立方体
ROLAP(Relational Online Analytical Processing)ROLAP架构并不会生成实际的多维数据集,而是使用雪花模式以及多个关系表对数据立方体进行模拟,它的OLAP引擎就是将用户的OLAP操作,如上钻下钻过滤合并等,转换成SQL语句提交到数据库中执行,并且提供聚集导航功能,根据用户操作的维度和度量将SQL查询定位到最粗粒度的事实表上去
这种架构下的查询没有MOLAP快速 。因为ROLAP中,所有的查询都是被转换为SQL语句执行的 。而这些SQL语句的执行会涉及到多个表之间的JOIN操作,没有MOLAP速度快,往往都是通过内存计算实现 。(内存的昂贵大家是知道的)
文章插图
ROLAP
MOLAP(Multidimensional Online Analytical Processing)
MOLAP架构会生成一个新的多维数据集,也可以说是构建了一个实际数据立方体 。事先将汇总数据计算好,存放在自己特定的多维数据库中,用户的OLAP操作可以直接映射到多维数据库的访问,不通过SQL访问 。(空间换时间,典型代表Kylin)
在该立方体中,每一格对应一个直接地址,且常用的查询已被预先计算好 。因此每次的查询都是非常快速的,但是由于立方体的更新比较慢,所以是否使用这种架构得具体问题具体分析 。
文章插图
MOLAP
HOLAP(Hybrid Online Analytical Processing)
这种架构综合参考MOLAP和ROLAP而采用一种混合解决方案,将某些需要特别提速的查询放到MOLAP引擎,其他查询则调用ROLAP引擎 。上述MOLAP和ROLAP的结合 。它提供了更大的灵活度,MOLAP提供提供了更加快速的响应速度 。但是带来的问题是,数据装载的效率非常低,因为其实就是将多维的数据预先填好,但是随着数据量过大维度成本越高,容易引起“数据爆炸” 。
文章插图
HOLAP
OLAP数据立方体(Data Cube)OLAP(online analytical processing)是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的 。从各方面观察信息,也就是从不同的维度分析数据,因此OLAP也称为多维分析 。很多年前,当我们要手工从一堆数据中提取信息时,我们会分析一堆数据报告 。通常这些数据报告采用二维表示,是行与列组成的二维表格 。但在真实世界里我们分析数据的角度很可能有多个,数据立方体可以理解为就是维度扩展后的二维表格 。下图展示了一个三维数据立方体:
推荐阅读
- 常见加密算法 「asp.net core 系列」12 数据加密算法
- 电热水器24小时开着好,还是用时再开好?了解后发现,多半人做错
- 供电局是怎么远程抄电表的,智能电表如何传送数据?看了算明白了
- 茶文化之了解茶的功效,蜀土茶称圣为川茶特殊历史渊源所作之歌词
- 淘宝店铺运营及分析的总结 如何分析优化淘宝客推广数据
- Streamlit是python的一个机器学习、数据科学、应用开发框架
- Python-Streamlit库再学习:st.slider和数据可视作图
- 淘宝行业大盘在哪里看 淘宝怎么看大盘实时数据
- 两万字深度介绍分布式,一文入魂
- 生意参谋怎么看竞品数据 生意参谋竞争商品怎么添加