你好,我是朱晓峰。 我们曾经开发过一个数据库应用系统,但是却突然遭遇了数据库宕机。在这种情况下,定位宕机的原因就非常关键,毕竟,知道了问题,才能确定解决方案。 这时,我们就想到了查看数据库的错误日志,因为日志中记录了数据库运行中的诊断信息,包括了错误、警告和注释等信息。从日志中,我们发现,原来某个连接中的SQL操作发生了死循环,导致内存不足,被系统强行终止了。知道了原因,处理起来也就比较轻松了,系统很快就恢复了运行。 除了发现错误,日志在数据复制、数据恢复、操作审计,以及确保数据的永久性和一致性等方面,都有着不可替代的作用,对提升你的数据库应用的开发能力至关重要。 今天,我就结合超市项目的实际案例,给你讲解一下怎么通过查看系统日志,来了解数据库中实际发生了什么,从而快速定位原因。 MySQL的日志种类非常多,包括通用查询日志、慢查询日志、错误日志、二进制日志、中继日志、重做日志和回滚日志,内容比较多,而且都很重要,所以我们来花两节课的时间学习一下。 这节课,我会先具体讲一讲通用查询日志、慢查询日志和错误日志。 ## 通用查询日志 **通用查询日志记录了所有用户的连接开始时间和截止时间,以及发给MySQL数据库服务器的所有SQL指令**。当我们的数据发生异常时,开启通用查询日志,还原操作时的具体场景,可以帮助我们准确定位问题。 举个小例子,在超市项目实施的过程中,我们曾遇到过这样一件事:超市经营者月底查账的时候发现,超市的1号门店在12月1日销售了5件化妆品,但是当天对应的历史库存并没有减少。化妆品的金额都比较大,库存不对的话,会在报表查询中产生巨额差异,触发到报警机制,对超市经营者的决策产生影响。超市经营者找到我们,对系统的可靠性提出质疑。 我们对系统进行了仔细检查,没有发现数据问题。可是商品确实卖出去了,当天的历史库存也确实没有消减。这个时候,我们想到了检查通用查询日志,看看当天到底发生了什么。 查看之后,我们就复原了当天的情况:12月1日下午,门店的收银台销售了5件化妆品,但是由于网络故障,流水没有及时上传到总部。12月1日晚上11:59,总部的历史库存被保存下来,但是因为没有收到门店的流水,所以没有消减库存。12月2日上午,门店的网络恢复了,流水得以上传总部,这个时候,对应化妆品的库存才被消减掉。 这样,我们就确定了故障的原因,也就是超市的网络问题,而系统本身是没有问题的。 你看,通用查询日志可以帮助我们了解操作发生的具体时间和操作的细节,对找出异常发生的原因极其关键。 下面我来具体介绍一下控制通用查询日志的系统变量。通过这些变量,你会清楚怎么控制通用查询日志的开启和关闭,以及保存日志的文件是哪个。 ``` mysql> SHOW VARIABLES LIKE '%general%'; +------------------+---------------+ | Variable_name | Value | +------------------+---------------+ | general_log | OFF | -- 通用查询日志处于关闭状态 | general_log_file | GJTECH-PC.log | -- 通用查询日志文件的名称是GJTECH-PC.log +------------------+---------------+ 2 rows in set, 1 warning (0.00 sec) ``` 在这个查询的结果中,有2点需要我们注意一下。 1. 系统变量general_log的值是OFF,表示通用查询日志处于关闭状态。在MySQL中,这个参数的默认值是关闭的。因为一旦开启记录通用查询日志,MySQL会记录所有的连接起止和相关的SQL操作,这样会消耗系统资源并且占用磁盘空间。我们可以通过手动修改变量的值,在需要的时候开启日志。 1. 通用查询日志文件的名称是GJTECH-PC.log。这样我们就知道在哪里可以查看通用查询日志的内容了。 下面我们来看看如何开启通用查询日志,把所有连接的起止和连接的SQL操作都记录下来。这个操作可以帮助我们追踪SQL操作故障的原因。 ### 开启通用查询日志 我们可以通过设置系统变量的值,来开启通用查询日志,并且指定通用查询日志的文件夹和文件名为“H:\mytest.log”。这个操作如下: ``` mysql> SET GLOBAL general_log = 'ON'; Query OK, 0 rows affected (0.00 sec) mysql> SET @@global.general_log_file = 'H:\mytest.log'; Query OK, 0 rows affected (0.02 sec) ``` 为了确认我们的设定是否已经生效,我们再来查询一下通用查询日志的状态: ``` mysql> SHOW VARIABLES LIKE '%general%'; +------------------+--------------+ | Variable_name | Value | +------------------+--------------+ | general_log | ON | -- 通用查询日志开启 | general_log_file | H:mytest.log | -- 日志名称也改过了 +------------------+--------------+ 2 rows in set, 1 warning (0.00 sec) ``` 结果显示,通用查询日志已经开启,文件是“H:\mytest.log”,这就意味着我们的操作成功了。 ### 查看通用查询日志 通用查询日志都是文本型数据,可以用记事本打开。下面我们就用记事本打开我电脑上的通用查询日志,实际看一看通用查询日志的内容,包括都有哪些连接,什么时候登录了数据库,都做了哪些操作等信息。 ``` 2021-04-05T06:39:53.621980Z 28 Connect zhangsan@localhost on using SSL/TLS -- 账号zhangsan从本地登录 2021-04-05T06:39:53.622085Z 28 Connect Access denied for user 'zhangsan'@'localhost' (using password: NO) -- 没有使用密码,连接被拒绝了 2021-04-05T06:40:02.522303Z 29 Connect zhangsan@localhost on using SSL/TLS 2021-04-05T06:40:02.522913Z 29 Query select @@version_comment limit 1 2021-04-05T06:40:14.211511Z 29 Query SELECT * FROM demo.invcount -- 查询数据表demo.invcount内容 2021-04-05T06:40:37.647625Z 29 Query UPDATE demo.invcount SET plquant = - 5 -- 更新数据表demo.invcount WHERE itemnumber = 1 2021-04-05T06:41:15.047067Z 29 Query SELECT * FROM demo.goodsmaster -- 查询数据表demo.goodsmaster ``` 在通用查询日志里面,我们可以清楚地看到,账号“zhangsan”是什么时间登录的服务器,登录之后做了什么SQL操作,针对的是哪个数据表等信息。 ### 删除通用查询日志 当用户对数据库的操作比较频繁时,通用查询日志文件会不断变大。为了节省磁盘空间,我们可以移除旧的日志文件,创建新的日志文件,来对通用查询日志文件进行维护。 第一步,关闭通用查询日志: ``` mysql> SET GLOBAL general_log = 'OFF'; -- 关闭通用查询日志 Query OK, 0 rows affected (0.01 sec) mysql> SHOW VARIABLES LIKE '%general_log%'; -- 查看通用查询日志状态 +------------------+--------------+ | Variable_name | Value | +------------------+--------------+ | general_log | OFF | | general_log_file | H:mytest.log | +------------------+--------------+ 2 rows in set, 1 warning (0.00 sec) ``` 第二步,把通用查询日志文件“H:\mytest.log”移至备份文件夹,空出磁盘H的空间。 第三步,开启通用查询日志: ``` mysql> SET GLOBAL general_log = 'ON'; Query OK, 0 rows affected (0.01 sec) mysql> SHOW VARIABLES LIKE '%general_log%'; +------------------+--------------+ | Variable_name | Value | +------------------+--------------+ | general_log | ON | | general_log_file | H:mytest.log | +------------------+--------------+ 2 rows in set, 1 warning (0.00 sec) ``` 这个时候,你会发现,MySQL已经给我们准备好了一个新的通用查询日志文件“H:\mytest.log”,并且记录了我们第一个查询的语句:“SHOW VARIABLES LIKE '%general_log%';”。 文件内容如下: ``` C:\Program Files\MySQL\MySQL Server 8.0\bin\mysqld.exe, Version: 8.0.23 (MySQL Community Server - GPL). started with: TCP Port: 3306, Named Pipe: MySQL Time Id Command Argument 2021-04-05T07:02:03.007394Z 30 Query SHOW VARIABLES LIKE '%general_log%' ``` 总之,开启了通用查询日志之后,如果遇到用户对数据产生质疑的情况,我们就可以通过查看通用查询日志,还原当时的场景,快速定位并解决问题。 ## 慢查询日志 **慢查询日志用来记录执行时间超过指定时长的查询**。它的主要作用是,帮助我们发现那些执行时间特别长的SQL查询,并且有针对性地进行优化,从而提高系统的整体效率。当我们的数据库服务器发生阻塞、运行变慢的时候,检查一下慢查询日志,找到那些慢查询,对解决问题很有帮助。 慢查询日志是由MySQL的配置文件进行控制的。下面我先简单介绍一下MySQL的配置文件。 在MySQL的安装目录中(C:\ProgramData\MySQL\MySQL Server 8.0),我们可以找到MySQL的配置文件“my.ini”。这个文件是一个文本格式的文件,可以直接用记事本打开来阅读。 我们来看看配置文件中关于慢查询日志变量的相关设定: ``` slow-query-log=1 -- 表示开启慢查询日志,系统将会对慢查询进行记录。 slow_query_log_file="GJTECH-PC-slow.log" -- 表示慢查询日志的名称是"GJTECH-PC-slow.log"。这里没有指定文件夹,默认就是数据目录:"C:\ProgramData\MySQL\MySQL Server 8.0\Data"。 long_query_time=10 -- 表示慢查询的标准是查询执行时间超过10秒 ``` 除了刚刚的这些变量,控制慢查询日志的还有一个系统变量:min_examined_row_limit。这个变量的意思是,查询扫描过的最少记录数。这个变量和查询执行时间,共同组成了判别一个查询是否是慢查询的条件。如果查询扫描过的记录数大于等于这个变量的值,并且查询执行时间超过long_query_time的值,那么,这个查询就被记录到慢查询日志中;反之,则不被记录到慢查询日志中。 如果要查看当前这个系统变量的值,我们就可以用下面的代码: ``` mysql> show variables like 'min%'; +------------------------+-------+ | Variable_name | Value | +------------------------+-------+ | min_examined_row_limit | 0 | +------------------------+-------+ 1 row in set, 1 warning (0.00 sec) ``` 这个值默认是0。与long_query_time=10合在一起,表示只要查询的执行时间超过10秒钟,哪怕一个记录也没有扫描过,都要被记录到慢查询日志中。你也可以根据需要,通过修改“my.ini”文件,来修改查询时长,或者通过SET指令,用SQL语句修改“min_examined_row_limit”的值。 只是你要注意,如果修改了MySQL的配置文件“my.ini”,就需要重启服务器,这样才能使修改生效。 来看一个例子:之前我运行的一个慢查询,被记录到了慢查询日志中。这个例子记录了一个运行时间超过10秒的慢查询的发生时间、连接所属的用户、执行的时长、锁表的时长和扫描过的记录数等相关信息。 ``` C:\Program Files\MySQL\MySQL Server 8.0\bin\mysqld.exe, Version: 8.0.23 (MySQL Community Server - GPL). started with: TCP Port: 3306, Named Pipe: MySQL Time Id Command Argument # Time: 2021-03-25T07:20:33.412260Z -- 执行开始时间 # User@Host: root[root] @ localhost [::1] Id: 13 -- 用户 # Query_time: 10.166435 Lock_time: 0.000000 Rows_sent: 0 Rows_examined: 0 -- 执行时长、锁表时长、检查的记录数 use demo; SET timestamp=1616656823; ``` 通过这个慢查询日志的记录,我们就可以发现是哪个查询消耗了大量的系统资源,是哪个连接里面的查询,具体什么时间开始的。有了这些信息,我们就可以对慢查询进行分析,决定优化的方式,避免出现同样的问题。 好了,到这里,通用查询日志和慢查询日志我就讲完了,咱们最后再来学习一种重要的日志:错误日志。 ## 错误日志 **错误日志记录了MySQL服务器启动、停止运行的时间,以及系统启动、运行和停止过程中的诊断信息,包括错误、警告和提示**等。当我们的数据库服务器发生系统故障时,错误日志是发现问题、解决故障的首选。 错误日志默认是开启的。我们可以在MySQL的配置文件“my.ini”中配置它: ``` # Error Logging. log-error="GJTECH-PC.err" ``` 这段代码指定了错误日志的文件名。如果没有指定文件夹,默认就是数据目录:“C:\ProgramData\MySQL\MySQL Server 8.0\Data”。 下面我们查看一下错误日志的内容: ``` 2021-02-28T08:07:07.228880Z 0 [System] [MY-010116] [Server] C:\Program Files\MySQL\MySQL Server 8.0\bin\mysqld.exe (mysqld 8.0.23) starting as process 7652 2021-02-28T08:07:07.270982Z 1 [System] [MY-013576] [InnoDB] InnoDB initialization has started. 2021-02-28T08:07:08.116433Z 1 [System] [MY-013577] [InnoDB] InnoDB initialization has ended. ``` 可以看到,错误日志文件中记录了服务器启动的时间,以及存储引擎InnoDB启动和停止的时间等。 ## 总结 今天这节课,我们学习了通用查询日志、慢查询日志和错误日志。 - 通用查询日志:可以记录所有连接的起始时间和终止时间,以及连接发送给数据库服务器的所有指令,对我们复原操作的实际场景、发现问题,甚至是对数据库操作的审计都有很大的帮助。 - 慢查询日志:可以记录运行时间和检查记录数超过指定值的查询,方便我们对查询进行优化。 - 错误日志:它记录了服务器启动、运行和停止过程中的诊断信息,方便我们了解服务器的状态,从而对服务器进行维护。 最后,我还是想提醒你一句,**千万不要小看日志**。很多看似奇怪的问题,答案往往就藏在日志里。很多情况下,只有通过查看日志才能发现问题的原因,真正解决问题。所以,一定要学会查看日志,养成检查日志的习惯。 ## 思考题 请你思考一下:怎么设置开启慢查询日志,并且把慢查询日志的指定时长设置为5秒,最少扫描记录数为1? 欢迎在留言区写下你的思考和答案,我们一起交流讨论。如果你觉得今天的内容对你有所帮助,也欢迎你分享给你的朋友或同事,我们下节课见。