MySQL复合查询全解析:从基础到多表关联与高级技巧
前言:
本文主要讲解了在MySQL中的复合查询,下面是关于本文章所需要数据的建表语句
创建表的语句:
DROP database IF EXISTS `scott`; CREATE database IF NOT EXISTS `scott` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci; USE `scott`; DROP TABLE IF EXISTS `dept`; CREATE TABLE `dept` ( `deptno` int(2) unsigned zerofill NOT NULL COMMENT '部门编号', `dname` varchar(14) DEFAULT NULL COMMENT '部门名称', `loc` varchar(13) DEFAULT NULL COMMENT '部门所在地点' ); DROP TABLE IF EXISTS `emp`; CREATE TABLE `emp` ( `empno` int(6) unsigned zerofill NOT NULL COMMENT '雇员编号', `ename` varchar(10) DEFAULT NULL COMMENT '雇员姓名', `job` varchar(9) DEFAULT NULL COMMENT '雇员职位', `mgr` int(4) unsigned zerofill DEFAULT NULL COMMENT '雇员领导编号', `hiredate` datetime DEFAULT NULL COMMENT '雇佣时间', `sal` decimal(7,2) DEFAULT NULL COMMENT '工资月薪', `comm` decimal(7,2) DEFAULT NULL COMMENT '奖金', `deptno` int(2) unsigned zerofill DEFAULT NULL COMMENT '部门编号' ); DROP TABLE IF EXISTS `salgrade`; CREATE TABLE `salgrade` ( `grade` int(11) DEFAULT NULL COMMENT '等级', `losal` int(11) DEFAULT NULL COMMENT '此等级最低工资', `hisal` int(11) DEFAULT NULL COMMENT '此等级最高工资' ); insert into dept (deptno, dname, loc) values (10, 'ACCOUNTING', 'NEW YORK'); insert into dept (deptno, dname, loc) values (20, 'RESEARCH', 'DALLAS'); insert into dept (deptno, dname, loc) values (30, 'SALES', 'CHICAGO'); insert into dept (deptno, dname, loc) values (40, 'OPERATIONS', 'BOSTON'); insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values (7369, 'SMITH', 'CLERK', 7902, '1980-12-17', 800, null, 20); insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values (7499, 'ALLEN', 'SALESMAN', 7698, '1981-02-20', 1600, 300, 30); insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values (7521, 'WARD', 'SALESMAN', 7698, '1981-02-22', 1250, 500, 30); insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values (7566, 'JONES', 'MANAGER', 7839, '1981-04-02', 2975, null, 20); insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values (7654, 'MARTIN', 'SALESMAN', 7698, '1981-09-28', 1250, 1400, 30); insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values (7698, 'BLAKE', 'MANAGER', 7839, '1981-05-01', 2850, null, 30); insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values (7782, 'CLARK', 'MANAGER', 7839, '1981-06-09', 2450, null, 10); insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values (7788, 'SCOTT', 'ANALYST', 7566, '1987-04-19', 3000, null, 20); insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values (7839, 'KING', 'PRESIDENT', null, '1981-11-17', 5000, null, 10); insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values (7844, 'TURNER', 'SALESMAN', 7698,'1981-09-08', 1500, 0, 30); insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values (7876, 'ADAMS', 'CLERK', 7788, '1987-05-23', 1100, null, 20); insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values (7900, 'JAMES', 'CLERK', 7698, '1981-12-03', 950, null, 30); insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values (7902, 'FORD', 'ANALYST', 7566, '1981-12-03', 3000, null, 20); insert into emp (empno, ename, job, mgr, hiredate, sal, comm, deptno) values (7934, 'MILLER', 'CLERK', 7782, '1982-01-23', 1300, null, 10); insert into salgrade (grade, losal, hisal) values (1, 700, 1200); insert into salgrade (grade, losal, hisal) values (2, 1201, 1400); insert into salgrade (grade, losal, hisal) values (3, 1401, 2000); insert into salgrade (grade, losal, hisal) values (4, 2001, 3000); insert into salgrade (grade, losal, hisal) values (5, 3001, 9999);
1.基本查询回顾:
1.1.查询工资高于500或岗位为MANAGER的雇员,同时还要满足他们的姓名首字母为大写的J
select * from EMP where (sal>500 or job='MANAGER') and ename like 'J%';
'J_' 和'J%' 的区别
这里‘J_’和‘J%’的主要区别在于它们所代表的字符串匹配模式的严格程度和范围。‘J_’更为严格,只匹配特定长度的字符串;而‘J%’则更为灵活,能匹配任意长度的字符串(只要以‘J’开头)。
1.2.按照部门号升序而雇员的工资降序排序
select * from EMP order by deptno, sal desc;
排序的时候默认是升序,降序需要自己写desc
1.3.使用年薪进行降序排序
注意为空的情况,要使用函数ifnull进行转换为0,不然用null参与计算还是null
函数ifnull()的用法
为什么最终的年薪是NULL呢,因为我们在表中发现有人的奖金是NULL,而我们的年薪计算方式就是月薪*12 + 奖金,而NULL是不参与计算的,因此最终的结果就是NULL,所以我们需要使用函数ifnull(comm,0),这样就把所有为NULL的数字变成0
注意前面的年薪使用过''之后,后面的年薪就不用加上引号了。
1.4.显示工资最高的员工的名字和工作岗位
select ename, job from EMP where sal = (select max(sal) from EMP);
这就是复合查询的体现,使用max(sal)获得最大薪资,然后获得最大数的薪资即可。
1.5.显示工资高于平均工资的员工信息
select ename, sal from EMP where sal>(select avg(sal) from EMP);
跟上一题本质是一样的
1.6.显示每个部门的平均工资和最高工资
select deptno, format(avg(sal), 2) , max(sal) from EMP group by deptno;
format()格式化函数的用法
- FORMAT(AVG(sal), 2) 的作用是将 AVG(sal)(平均工资)格式化为具有两位小数的形式。
这是没有格式化的效果:
这是格式化数据的效果:
select deptno ,format(avg(sal),2), max(sal) from emp group by deptno;
1.7.显示平均工资低于2000的部门号和它的平均工资
select deptno, avg(sal) as avg_sal from EMP group by deptno having avg_sal select ename, sal, deptno from emp where sal > all(select sal from emp where deptno=30);
当然直接用函数书写也可以。
select ename,sal,deptno from emp where sal > (select max(sal) from emp where deptno = 30);
4.2.3.any关键字;
显示工资比部门30的任意员工的工资高的员工的姓名、工资和部门号(包含自己部门
的员工)
select ename, sal, deptno from EMP where sal > any(select sal from EMP where deptno=30);
当然用min函数也可以:
select ename,sal,deptno from emp where sal > (select min(sal) from emp where deptno = 30);
4.3 多列子查询
单行子查询是指子查询只返回单列,单行数据;多行子查询是指返回单列多行数据,都是针对单列而言的,而多列子查询则是指查询返回多个列数据的子查询语句
案例:
4.3.1.查询和SMITH的部门和岗位完全相同的所有雇员,不含SMITH本人
代码:
mysql> select ename from EMP where (deptno, job)=(select deptno, job from EMP where ename='SMITH') and ename 'SMITH';
注意点:
顺序必须一致,不然就会报错
嵌套的select语句必须加上括号
4.4 在from子句中使用子查询
子查询语句出现在from子句中。这里要用到数据查询的技巧,把一个子查询当做一个临时表使用。
案例:
4.4.1.显示每个高于自己部门平均工资的员工的姓名、部门、工资、平均工资
获取各个部门的平均工资,将其看作临时表
//获取各个部门的平均工资,将其看作临时表 select ename, deptno, sal, format(asal,2) from EMP, (select avg(sal) asal, deptno dt from EMP group by deptno) tmp where EMP.sal > tmp.asal and EMP.deptno=tmp.dt;
4.4.2.查找每个部门工资最高的人的姓名、工资、部门、最高工资
select ename, sal,emp.deptno,最高工资 from emp, (select deptno ,max(sal) '最高工资' from emp group by deptno) tmp where emp.deptno = tmp.deptno and emp.sal = 最高工资;
4.4.3.显示每个部门的信息(部门名,编号,地址)和人员数量
-- 1. 对EMP表进行人员统计 select count(*), deptno from EMP group by deptno; -- 2. 将上面的表看作临时表 select DEPT.deptno, dname, mycnt, loc from DEPT, (select count(*) mycnt, deptno from EMP group by deptno) tmp where DEPT.deptno=tmp.deptno;
4.5 合并查询
在实际应用中,为了合并多个select的执行结果,可以使用集合操作符 union,union all
4.5.1 union(自动去重)
该操作符用于取得两个结果集的并集。当使用该操作符时,会自动去掉结果集中的重复行。
案例:将工资大于2500或职位是MANAGER的人找出来
select * from emp where sal > 2500 union select * from emp where job = 'MANAGER';
4.5.3 union all(不去重)
该操作符用于取得两个结果集的并集。当使用该操作符时,不会去掉结果集中的重复行。
案例:将工资大于25000或职位是MANAGER的人找出来
select * from emp where sal > 2500 union all select * from emp where job = 'MANAGER';
5.表的内连和外连
5.1 内连接
内连接实际上就是利用where子句对两种表形成的笛卡儿积进行筛选,我们前面学习的查询都是内连接,也是在开发过程中使用的最多的连接查询。
语法:
select 字段 from 表1 inner join 表2 on 连接条件 and 其他条件;
备注:前面学习的都是内连接
案例:显示SMITH的名字和部门名称
-- 用前面的写法 select ename, dname from EMP, DEPT where EMP.deptno=DEPT.deptno and ename='SMITH'; -- 用标准的内连接写法 select ename, dname from EMP inner join DEPT on EMP.deptno=DEPT.deptno and ename='SMITH';
5.2 外连接
外连接分为左外连接和右外连接
5.2.1 左外连接
如果联合查询,左侧的表完全显示我们就说是左外连接。
语法:
select 字段名 from 表名1 left join 表名2 on 连接条件
案例:
-- 建两张表 create table stu (id int, name varchar(30)); -- 学生表 insert into stu values(1,'jack'),(2,'tom'),(3,'kity'),(4,'nono'); create table exam (id int, grade int); -- 成绩表 insert into exam values(1, 56),(2,76),(11, 8);
查询所有学生的成绩,如果这个学生没有成绩,也要将学生的个人信息显示出来
-- 当左边表和右边表没有匹配时,也会显示左边表的数据 select * from stu left join exam on stu.id=exam.id;
如果我们使用内连接,左表的数据就不会完全显示出来,但是用左连接,左表的数据就算为空也会显示出来!
5.2.2 右外连接
如果联合查询,右侧的表完全显示我们就说是右外连接。
语法:
select 字段 from 表名1 right join 表名2 on 连接条件;
其实左连接和右连接是一样的,如果将两个表名交换过来,左连接也可以是右连接!
案例:
对stu表和exam表联合查询,把所有的成绩都显示出来,即使这个成绩没有学生与它对应,也要
显示出来
select * from stu right join exam on stu.id=exam.id;
左连接和右连接的互相转换:
列出部门名称和这些部门的员工信息,同时列出没有员工的部门
方法一: select d.dname, e.* from dept d left join emp e on d.deptno=e.deptno; 方法二: select d.dname, e.* from emp e right join dept d on d.deptno=e.deptno;
总结:
小技巧:
任何时刻,查询出来的临时结构,本质在逻辑上也是表结构。
解决多表问题的本质:想办法将多表转化为单表,所以MySQL中,所有select的问题全部都可以转成单表问题!