CategoryResourceRepost/极客时间专栏/MySQL 必知必会/进阶篇/16 | 游标:对于数据集中的记录,该怎么逐条处理?.md
louzefeng d3828a7aee mod
2024-07-11 05:50:32 +00:00

307 lines
15 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

<audio id="audio" title="16 | 游标:对于数据集中的记录,该怎么逐条处理?" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/da/fd/da01c9fbaa9dbd0c468c9089e7fdf5fd.mp3"></audio>
你好,我是朱晓峰。今天,我来和你聊一聊游标。
咱们前面学习的MySQL数据操作语句都是针对结果集合的。也就是说每次处理的对象都是一个数据集合。如果需要逐一处理结果集中的记录就会非常困难。
虽然我们也可以通过筛选条件WHERE和HAVING或者是限定返回记录的关键字LIMIT返回一条记录但是却无法在结果集中像指针一样向前定位一条记录、向后定位一条记录或者是随意定位到某一条记录并对记录的数据进行处理。
这个时候,就可以用到游标。所谓的游标,也就是能够对结果集中的每一条记录进行定位,并对指向的记录中的数据进行操作的数据结构。
这么说可能有点抽象我举一个生活中的例子你一看就明白了。比如你想去某个城市旅游现在需要订酒店。你打开预订酒店的App设置好价格区间后进行搜索得到了一个酒店列表。接下来你可能要逐条查看列表中每个酒店的客户评价最后选择一个口碑不错的酒店。这个逐条搜索并对选中的数据进行操作的过程就相当于游标对数据记录进行操作的过程。
今天我就来给你讲一讲游标的使用方法,同时还会通过一个案例串讲,帮助你更好地使用游标,让你能够轻松地处理数据集中的记录。
# 游标的使用步骤
游标只能在存储程序内使用,存储程序包括存储过程和存储函数。关于存储过程,我们上节课刚刚学过,这里我简单介绍一下存储函数。创建存储函数的语法是:
```
CREATE FUNCTION 函数名称 参数RETURNS 数据类型 程序体
```
存储函数与存储过程很像,但有几个不同点:
1. 存储函数必须返回一个值或者数据表,存储过程可以不返回。
1. 存储过程可以通过CALL语句调用存储函数不可以。
1. 存储函数可以放在查询语句中使用,存储过程不行。
1. 存储过程的功能更加强大,包括能够执行对表的操作(比如创建表,删除表等)和事务操作,这些功能是存储函数不具备的。
这节课,我们主要学习下游标在存储过程中的使用方法,因为游标在存储过程中更常用。游标在存储函数中的使用方法和在存储过程中的使用方法是一样的。
在使用游标的时候主要有4个步骤。
第一步,定义游标。语法结构如下:
```
DECLARE 游标名 CURSOR FOR 查询语句
```
这里就是声明一个游标,它可以操作的数据集是“查询语句”返回的结果集。
第二步,打开游标。语法结构如下:
```
OPEN 游标名称;
```
打开游标之后,系统会为游标准备好查询的结果集,为后面游标的逐条读取结果集中的记录做准备。
第三步,从游标的数据结果集中读取数据。语法结构是这样的:
```
FETCH 游标名 INTO 变量列表;
```
这里的意思是通过游标,把当前游标指向的结果集中那一条记录的数据,赋值给列表中的变量。
需要注意的是,**游标的查询结果集中的字段数必须跟INTO后面的变量数一致**否则在存储过程执行的时候MySQL会提示错误。
第四步,关闭游标。语法结构如下:
```
CLOSE 游标名;
```
**用完游标之后,你一定要记住及时关闭游标**。因为游标会占用系统资源,如果不及时关闭,游标会一直保持到存储过程结束,影响系统运行的效率。而关闭游标的操作,会释放游标占用的系统资源。
知道了基本步骤,下面我就结合超市项目的实际案例,带你实战一下。
# 案例串讲
在超市项目的进货模块中,有一项功能是对进货单数据进行验收。其实就是在对进货单的数据确认无误后,对进货单的数据进行处理,包括增加进货商品的库存,并修改商品的平均进价。下面我用实际数据来演示一下这个操作流程。
这里我们要用到进货单头表demo.importheadl、进货单明细表demo.importdetails、库存表demo.inventory和商品信息表demo.goodsmaster
进货单头表:
<img src="https://static001.geekbang.org/resource/image/aa/97/aa133989325a1125ff118bce9993ec97.jpeg" alt="">
进货单明细表:
<img src="https://static001.geekbang.org/resource/image/a5/b3/a5b6af4f27a24e003bced20e044336b3.jpeg" alt="">
库存表:
<img src="https://static001.geekbang.org/resource/image/1e/d3/1e1c6d83d75094376bf21e6f4c0572d3.jpeg" alt="">
商品信息表:
<img src="https://static001.geekbang.org/resource/image/cd/8e/cd9832d7cac00446b937462518bf018e.jpeg" alt="">
要验收进货单,我们就需要对每一个进货商品进行两个操作:
1. 在现有库存数量的基础上,加上本次进货的数量;
1. 根据本次进货的价格、数量,现有商品的平均进价和库存,计算新的平均进价:(本次进货价格 * 本次进货数量+现有商品平均进价 * 现有商品库存)/(本次进货数量+现有库存数量)。
针对这个操作,如果只用我们在[第4讲](https://time.geekbang.org/column/article/351225)里学习的SQL语句完成起来就比较困难。
因为我们需要通过应用程序来控制操作流程做成一个循环操作每次只查询一种商品的数据记录并进行处理一直到把进货单中的数据全部处理完。这样一来应用必须发送很多的SQL指令到服务器跟服务器的交互多不仅代码复杂而且也不够安全。
这个时候,如果使用游标,就很容易了。因为所有的操作都可以在服务器端完成,应用程序只需要发送一个命令调用存储过程就可以了。现在,我们就来看看如何用游标来解决这个问题。
我用代码创建了一个存储过程demo.mytest。当然你也完全可以在Workbench中创建存储过程非常简单我就不多说了。创建存储过程的代码如下
```
mysql&gt; DELIMITER //
mysql&gt; CREATE PROCEDURE demo.mytest(mylistnumber INT)
-&gt; BEGIN
-&gt; DECLARE mystockid INT;
-&gt; DECLARE myitemnumber INT;
-&gt; DECLARE myquantity DECIMAL(10,3);
-&gt; DECLARE myprice DECIMAL(10,2);
-&gt; DECLARE done INT DEFAULT FALSE; -- 用来控制循环结束
-&gt; DECLARE cursor_importdata CURSOR FOR -- 定义游标
-&gt; SELECT b.stockid,a.itemnumber,a.quantity,a.importprice
-&gt; FROM demo.importdetails AS a
-&gt; JOIN demo.importhead AS b
-&gt; ON (a.listnumber=b.listnumber)
-&gt; WHERE a.listnumber = mylistnumber;
-&gt; DECLARE CONTINUE HANDLER FOR NOT FOUND SET done = TRUE; -- 条件处理语句
-&gt;
-&gt; OPEN cursor_importdata; -- 打开游标
-&gt; FETCH cursor_importdata INTO mystockid,myitemnumber,myquantity,myprice; -- 读入第一条记录
-&gt; REPEAT
-&gt; -- 更新进价
-&gt; UPDATE demo.goodsmaster AS a,demo.inventory AS b
-&gt; SET a.avgimportprice = (a.avgimportprice*b.invquantity+myprice*myquantity)/(b.invquantity+myquantity)
-&gt; WHERE a.itemnumber=b.itemnumber AND b.stockid=mystockid AND a.itemnumber=myitemnumber;
-&gt; -- 更新库存
-&gt; UPDATE demo.inventory
-&gt; SET invquantity = invquantity + myquantity
-&gt; WHERE stockid = mystockid AND itemnumber=myitemnumber;
-&gt; -- 获取下一条记录
-&gt; FETCH cursor_importdata INTO mystockid,myitemnumber,myquantity,myprice;
-&gt; UNTIL done END REPEAT;
-&gt; CLOSE cursor_importdata;
-&gt; END
-&gt; //
Query OK, 0 rows affected (0.02 sec)
-&gt; DELIMITER ;
```
这段代码比较长核心操作有6步我来给你详细解释下。
1. 把MySQL的分隔符改成“//”。
1. 开始程序体之后我定义了4个变量分别是mystockid、myitemnumber、myquantity和myprice这几个变量的作用是存储游标中读取的仓库编号、商品编号、进货数量和进货价格数据。
1. 定义游标。这里我指定了游标的名称以及游标可以处理的数据集mylistnumber指定的进货单的全部进货商品明细数据
1. 定义条件处理语句“DECLARE CONTINUE HANDLER FOR NOT FOUND SET done = TRUE;”。
1. 打开游标,读入第一条记录,然后开始执行数据操作。
1. 关闭游标,结束程序。
可以看到,在这个存储过程中,我用到了条件处理语句,它的作用是告诉系统,在存储程序遇到问题的时候,应该如何处理。
## 条件处理语句
条件处理语句的语法结构:
```
DECLARE 处理方式 HANDLER FOR 问题 操作;
```
下面我结合刚刚的“DECLARE CONTINUE HANDLER FOR NOT FOUND SET done = TRUE;”,来解释一下条件处理语句是如何工作的。
1. **语法结构中的“问题”是指SQL操作中遇到了什么问题**。比如这里的问题是“NOT FOUND”意思就是游标走到结果集的最后没有记录了。也就是说数据集中的所有记录都已经处理完了。
1. 执行的操作是“SET done=TRUE”done是我定义的用来标识数据集中的数据是否已经处理完成的一个标记。done=TRUE意思是数据处理完成了。
1. **处理方式有2种选择分别是“CONTINUE”和“EXIT”**,表示遇到问题,执行了语法结构中的“操作”之后,是选择继续运行程序,还是选择退出,结束程序。
所以,这个条件处理语句的意思就是:当游标读到结果集的最后,没有记录了,设置操作完成标识为真,然后继续运行程序。
在存储过程的第5步为了逐一处理每一条记录我还使用了流程控制语句。
解决复杂问题不可能通过一个SQL语句完成我们需要执行多个SQL操作。流程控制语句的作用就是控制存储过程中SQL语句的执行顺序是我们完成复杂操作必不可少的一部分。下面我就给你具体讲解一下。
## 流程控制语句
MySQL的流程控制语句也只能用于存储程序。主要有3类。
1. 跳转语句ITERATE和LEAVE语句。
1. 循环语句LOOP、WHILE和REPEAT语句。
1. 条件判断语句IF语句和CASE语句。
接下来我依次讲解一下跳转语句、循环语句和条件判断语句。
### 跳转语句
1. ITERATE语句只能用在循环语句内表示重新开始循环。
1. LEAVE语句可以用在循环语句内或者以BEGIN和END包裹起来的程序体内表示跳出循环或者跳出程序体的操作。
### 循环语句
LOOP语句的语法结构是
```
标签LOOP
操作
END LOOP 标签;
```
关于这个语句需要注意的是LOOP循环不能自己结束需要用跳转语句ITERATE或者LEAVE来进行控制。
WHILE语句的语法结构
```
WHILE 条件 DO
操作
END WHILE;
```
WHILE循环通过判断条件是否为真来决定是否继续执行循环中的操作你要注意一点**WHILE循环是先判断条件再执行循环体中的操作**。
REPEAT语句的语法结构
```
REPEAT
操作
UNTIL 条件 END REPEAT
```
REPEAT循环也是通过判断条件是否为真来决定是否继续执行循环内的操作的与WHILE不同的是**REPEAT循环是先执行操作后判断条件**。
最后我来讲讲条件判断语句IF语句和CASE语句。
### 条件判断语句
IF语句的语法结构是
```
IF 表达式1 THEN 操作1
[ELSEIF 表达式2 THEN 操作2]……
[ELSE 操作N]
END IF
```
这里“[]”中的内容是可选的。**IF语句的特点是不同的表达式对应不同的操作**。
CASE语句的语法结构是
```
CASE 表达式
WHEN 值1 THEN 操作1
[WHEN 值2 THEN 操作2]……
[ELSE 操作N]
END CASE;
```
这里“[]”中的内容是可选的。CASE语句的特点是表达式不同的值对应不同的操作。
到这里,我们处理进货单验收的存储过程就创建好了。现在,让我们来运行一下这个存储过程,看看能不能得到我们想要的结果:
```
mysql&gt; CALL demo.mytest(1234); -- 调用存储过程验收单号是1234的进货单
Query OK, 0 rows affected (11.68 sec) -- 执行成功了
mysql&gt; select * from demo.inventory; -- 查看库存,已经改过来了
+---------+------------+-------------+
| stockid | itemnumber | invquantity |
+---------+------------+-------------+
| 1 | 1 | 15.000 |
| 1 | 2 | 23.000 |
+---------+------------+-------------+
2 rows in set (0.00 sec)
mysql&gt; select * from demo.goodsmaster; -- 查看商品信息表,平均进价也改过来了
+------------+---------+-----------+---------------+------+------------+----------------+
| itemnumber | barcode | goodsname | specification | unit | salesprice | avgimportprice |
+------------+---------+-----------+---------------+------+------------+----------------+
| 1 | 0001 | 书 | 16开 | 本 | 89.00 | 31.00 |
| 2 | 0002 | 笔 | NULL | 包 | 5.00 | 2.87 |
+------------+---------+-----------+---------------+------+------------+----------------+
2 rows in set (0.00 sec)
```
很显然,库存和平均价格都被正确地计算出来了。
最后,有个小问题要提醒你注意:**如果一个操作要用到另外一个操作的结果,那我们一定不能搞错操作的顺序**。比如,在刚刚的例子中,我是先计算平均价格,后消减库存数量,这就是因为,计算平均价格的时候会用到库存数量,如果先消减库存数量,平均价格的计算就会不准。
# 总结
这节课我们学习了游标的使用方法包括在存储过程中使用游标的4个步骤分别是定义游标、打开游标、读取游标数据和关闭游标。除此之外我还介绍了经常与游标结合使用的流程控制语句包括循环语句LOOP、WHILE和REPEAT条件判断语句IF和CASE还有跳转语句LEAVE和ITERATE。
游标是MySQL的一个重要的功能为逐条读取结果集中的数据提供了完美的解决方案。跟在应用层面实现相同的功能相比游标可以在存储程序中使用效率高程序也更加简洁。但是游标会消耗系统资源所以我建议你养成用完之后就关闭的习惯这样才能提高系统的整体效率。
# 思考题
假设我有一个数据表demo.test具体信息如下所示
<img src="https://static001.geekbang.org/resource/image/a6/44/a62ccd9ea5e88cfa793dc837a1168f44.jpeg" alt="">
你能自己写一个简单的存储过程,用游标来逐一处理一个数据表中的数据吗?
要求编号为偶数的记录myquant=myquant+1编号是奇数的记录myquant=myquant+2。
欢迎在留言区写下你的思考和答案,我们一起交流讨论。如果你觉得今天的内容对你有所帮助,欢迎你把它分享给你的朋友或同事,我们下节课见。