1.为什么要小表驱动大表呢类似循环嵌套
for(int i=5;.......){ for(int j=1000;......) {}}如果小的循环在外层,对于数据库连接来说就只连接5次,进行5000次操作,如果1000在外,则需要进行1000次数据库连接,从而浪费资源,增加消耗 。这就是为什么要小表驱动大表 。
比如:我们在tb_dept_bigdata表中插入100条数据,在tb_emp_bigdata表中插入5000条数据 。
文章插图
文章插图
注:100个部门,5000个员工 。tb_dept_bigdata(小表),tb_emp_bigdata(大表) 。
【在查询的优化中为什么要永远小表驱动大表?】①当B表的数据集小于A表数据集时,用in由于exists 。
select *from tb_emp_bigdata A where A.deptno in (select B.deptno from tb_dept_bigdata B)B表为tb_dept_bigdata:100条数据,A表tb_emp_bigdata:5000条数据 。
用in的查询时间为:
文章插图
经对比可看到,在B表数据集小于A表的时候,用in要由于exists,当前的数据集并不大,所以查询时间相差并不多 。
②当A表的数据集小于B表的数据集时,用exists由于in 。
select *from tb_dept_bigdata A where A.deptno in(select B.deptno from tb_emp_bigdata B);用in的查询时间为:
文章插图
将上面sql转换成exists:
select *from tb_dept_bigdata A where exists(select 1 from tb_emp_bigdata B where B.deptno=A.deptno);用exists的查询时间:
文章插图
由于数据量并不是很大,因此对比并不是难么的强烈 。
附上结论截图:
文章插图
.总结下面结论都是针对in或exists的 。
in后面跟的是小表,exists后面跟的是大表 。
简记:in小,exists大 。
对于exists
select .....from table where exists(subquery);
可以理解为:将主查询的数据放入子查询中做条件验证,根据验证结果(true或false)来决定主查询的数据是否得以保留 。
推荐阅读
- 2米的床买多大的四件套,2米的床买多大的床垫
- 燃气灶换电池在哪里换,燃气灶没电池了是什么状态
- Go垃圾回收GC详解
- 81岁老人去世怎么讲究 老人81岁死的怎么破解
- 长角的动物有哪些? 世界上牛角最长的牛
- 硬盘为什么要分区,对性能有影响吗
- 中国最聪明的小孩是谁
- 史上最全 Java 中各种锁的介绍
- 沈阳桃仙机场的菊花茶到底贵不贵
- Google与OTA的供需聚合论