CategoryResourceRepost/极客时间专栏/SQL必知必会/第一章:SQL语法基础篇/10丨常用的SQL标准有哪些,在SQL92中是如何使用连接的?.md
louzefeng d3828a7aee mod
2024-07-11 05:50:32 +00:00

197 lines
11 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

<audio id="audio" title="10丨常用的SQL标准有哪些在SQL92中是如何使用连接的" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/3e/20/3ed9950803e443beffc8820d8369ac20.mp3"></audio>
今天我主要讲解连接表的操作。在讲解之前我想先给你介绍下连接JOIN在SQL中的重要性。
我们知道SQL的英文全称叫做Structured Query Language它有一个很强大的功能就是能在各个数据表之间进行连接查询Query。这是因为SQL是建立在关系型数据库基础上的一种语言。关系型数据库的典型数据结构就是数据表这些数据表的组成都是结构化的Structured。你可以把关系模型理解成一个二维表格模型这个二维表格是由行row和列column组成的。每一个行row就是一条数据每一列column就是数据在某一维度的属性。
正是因为在数据库中表的组成是基于关系模型的所以一个表就是一个关系。一个数据库中可以包括多个表也就是存在多种数据之间的关系。而我们之所以能使用SQL语言对各个数据表进行复杂查询核心就在于连接它可以用一条SELECT语句在多张表之间进行查询。你也可以理解为关系型数据库的核心之一就是连接。
既然连接在SQL中这么重要那么针对今天的内容需要你从以下几个方面进行掌握
1. SQL实际上存在不同的标准不同标准下的连接定义也有不同。你首先需要了解常用的SQL标准有哪些
1. 了解了SQL的标准之后我们从SQL92标准入门来看下连接表的种类有哪些
1. 针对一个实际的数据库表,如果你想要做数据统计,需要学会使用跨表的连接进行操作。
## 常用的SQL标准有哪些
在正式开始讲连接表的种类时我们首先需要知道SQL存在不同版本的标准规范因为不同规范下的表连接操作是有区别的。
SQL有两个主要的标准分别是SQL92和SQL99。92和99代表了标准提出的时间SQL92就是92年提出的标准规范。当然除了SQL92和SQL99以外还存在SQL-86、SQL-89、SQL:2003、SQL:2008、SQL:2011和SQL:2016等其他的标准。
这么多标准到底该学习哪个呢实际上最重要的SQL标准就是SQL92和SQL99。一般来说SQL92的形式更简单但是写的SQL语句会比较长可读性较差。而SQL99相比于SQL92来说语法更加复杂但可读性更强。我们从这两个标准发布的页数也能看出SQL92的标准有500页而SQL99标准超过了1000页。实际上你不用担心要学习这么多内容基本上从SQL99之后很少有人能掌握所有内容因为确实太多了。就好比我们使用Windows、Linux和Office的时候很少有人能掌握全部内容一样。我们只需要掌握一些核心的功能满足日常工作的需求即可。
## 在SQL92中是如何使用连接的
相比于SQL99SQL92规则更简单更适合入门。在这篇文章中我会先讲SQL92是如何对连接表进行操作的下一篇文章再讲SQL99到时候你可以对比下这两者之间有什么区别。
在进行连接之前我们需要用数据表做举例。这里我创建了NBA球员和球队两张表SQL文件你可以从[GitHub](https://github.com/cystanford/sql_nba_data)上下载。
其中player表为球员表一共有37个球员如下所示
<img src="https://static001.geekbang.org/resource/image/e3/1b/e327a3eeeb7a7195a7ae0703ebd8e51b.png" alt=""><br>
team表为球队表一共有3支球队如下所示
<img src="https://static001.geekbang.org/resource/image/b5/39/b5228a60a4ccffa5b2848fe82d575239.png" alt=""><br>
有了这两个数据表之后我们再来看下SQL92中的5种连接方式它们分别是笛卡尔积、等值连接、非等值连接、外连接左连接、右连接和自连接。
### 笛卡尔积
笛卡尔乘积是一个数学运算。假设我有两个集合X和Y那么X和Y的笛卡尔积就是X和Y的所有可能组合也就是第一个对象来自于X第二个对象来自于Y的所有可能。
我们假定player表的数据是集合X先进行SQL查询
```
SELECT * FROM player
```
再假定team表的数据为集合Y同样需要进行SQL查询
```
SELECT * FROM team
```
你会看到运行结果会显示出上面的两张表格。
接着我们再来看下两张表的笛卡尔积的结果,这是笛卡尔积的调用方式:
```
SQL: SELECT * FROM player, team
```
运行结果一共37*3=111条记录
<img src="https://static001.geekbang.org/resource/image/2e/37/2e66048cba86811a740a85f68d81c537.png" alt=""><br>
笛卡尔积也称为交叉连接英文是CROSS JOIN它的作用就是可以把任意表进行连接即使这两张表不相关。但我们通常进行连接还是需要筛选的因此你需要在连接后面加上WHERE子句也就是作为过滤条件对连接数据进行筛选。比如后面要讲到的等值连接。
### 等值连接
两张表的等值连接就是用两张表中都存在的列进行连接。我们也可以对多张表进行等值连接。
针对player表和team表都存在team_id这一列我们可以用等值连接进行查询。
```
SQL: SELECT player_id, player.team_id, player_name, height, team_name FROM player, team WHERE player.team_id = team.team_id
```
运行结果一共37条记录
<img src="https://static001.geekbang.org/resource/image/28/d9/282aa15e7d02c60e9ebba8a0cc9134d9.png" alt=""><br>
我们在进行等值连接的时候可以使用表的别名这样会让SQL语句更简洁
```
SELECT player_id, a.team_id, player_name, height, team_name FROM player AS a, team AS b WHERE a.team_id = b.team_id
```
需要注意的是如果我们使用了表的别名在查询字段中就只能使用别名进行代替不能使用原有的表名比如下面的SQL查询就会报错
```
SELECT player_id, player.team_id, player_name, height, team_name FROM player AS a, team AS b WHERE a.team_id = b.team_id
```
### 非等值连接
当我们进行多表查询的时候,如果连接多个表的条件是等号时,就是等值连接,其他的运算符连接就是非等值查询。
这里我创建一个身高级别表height_grades如下所示
<img src="https://static001.geekbang.org/resource/image/cf/68/cf5ea984ba0c4501c5a4e1eec19e5b68.png" alt=""><br>
我们知道player表中有身高height字段如果想要知道每个球员的身高的级别可以采用非等值连接查询。
```
SQLSELECT p.player_name, p.height, h.height_level
FROM player AS p, height_grades AS h
WHERE p.height BETWEEN h.height_lowest AND h.height_highest
```
运行结果37条记录
<img src="https://static001.geekbang.org/resource/image/fa/84/fa049e7e186978e7086eb8e157fdc284.png" alt="">
### 外连接
除了查询满足条件的记录以外外连接还可以查询某一方不满足条件的记录。两张表的外连接会有一张是主表另一张是从表。如果是多张表的外连接那么第一张表是主表即显示全部的行而第剩下的表则显示对应连接的信息。在SQL92中采用+代表从表所在的位置而且在SQL92中只有左外连接和右外连接没有全外连接。
什么是左外连接,什么是右外连接呢?
左外连接,就是指左边的表是主表,需要显示左边表的全部行,而右侧的表是从表,(+)表示哪个是从表。
```
SQLSELECT * FROM player, team where player.team_id = team.team_id(+)
```
相当于SQL99中的
```
SQLSELECT * FROM player LEFT JOIN team on player.team_id = team.team_id
```
右外连接,指的就是右边的表是主表,需要显示右边表的全部行,而左侧的表是从表。
```
SQLSELECT * FROM player, team where player.team_id(+) = team.team_id
```
相当于SQL99中的
```
SQLSELECT * FROM player RIGHT JOIN team on player.team_id = team.team_id
```
需要注意的是LEFT JOIN和RIGHT JOIN只存在于SQL99及以后的标准中在SQL92中不存在只能用+)表示。
### 自连接
自连接可以对多个表进行操作,也可以对同一个表进行操作。也就是说查询条件使用了当前表的字段。
比如我们想要查看比布雷克·格里芬高的球员都有谁,以及他们的对应身高:
```
SQLSELECT b.player_name, b.height FROM player as a , player as b WHERE a.player_name = '布雷克-格里芬' and a.height &lt; b.height
```
运行结果6条记录
<img src="https://static001.geekbang.org/resource/image/05/94/05e4bf92df00e243601ca2d763fabb94.png" alt=""><br>
如果不用自连接的话需要采用两次SQL查询。首先需要查询布雷克·格里芬的身高。
```
SQLSELECT height FROM player WHERE player_name = '布雷克-格里芬'
```
运行结果为2.08。
然后再查询比2.08高的球员都有谁,以及他们的对应身高:
```
SQLSELECT player_name, height FROM player WHERE height &gt; 2.08
```
运行结果和采用自连接的运行结果是一致的。
## 总结
今天我讲解了常用的SQL标准以及SQL92中的连接操作。SQL92和SQL99是经典的SQL标准也分别叫做SQL-2和SQL-3标准。也正是在这两个标准发布之后SQL影响力越来越大甚至超越了数据库领域。现如今SQL已经不仅仅是数据库领域的主流语言还是信息领域中信息处理的主流语言。在图形检索、图像检索以及语音检索中都能看到SQL语言的使用。
除此以外我们使用的主流RDBMS比如MySQL、Oracle、SQL Sever、DB2、PostgreSQL等都支持SQL语言也就是说它们的使用符合大部分SQL标准但很难完全符合因为这些数据库管理系统都在SQL语言的基础上根据自身产品的特点进行了扩充。即使这样SQL语言也是目前所有语言中半衰期最长的在1992年Windows3.1发布SQL92标准也同时发布如今我们早已不使用Windows3.1操作系统而SQL92标准却一直持续至今。
当然我们也要注意到SQL标准的变化以及不同数据库管理系统使用时的差别比如Oracle对SQL92支持较好而MySQL则不支持SQL92的外连接。
<img src="https://static001.geekbang.org/resource/image/e4/0d/e473b216f11cfa7696371bfeadba220d.jpg" alt=""><br>
我今天讲解了SQL的连接操作你能说说内连接、外连接和自连接指的是什么吗另外你不妨拿案例中的team表做一道动手题表格中一共有3支球队现在这3支球队需要进行比赛请用一条SQL语句显示出所有可能的比赛组合。
欢迎你在评论区写下你的答案,也欢迎把这篇文章分享给你的朋友或者同事,与他们一起交流一下。