learn.lianglianglee.com/专栏/MySQL实战45讲/24 MySQL是怎么保证主备一致的？.md.html

<!DOCTYPE html>
<!-- saved from url=(0046)https://kaiiiz.github.io/hexo-theme-book-demo/ -->
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
        <meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1.0, user-scalable=no">
        <link rel="icon" href="/static/favicon.png">
        <title>24  MySQL是怎么保证主备一致的？.md.html</title>
        <!-- Spectre.css framework -->
        <link rel="stylesheet" href="/static/index.css">
        <!-- theme css & js -->
        <meta name="generator" content="Hexo 4.2.0">
    </head>
<body>
<div class="book-container">
    <div class="book-sidebar">
        <div class="book-brand">
            <a href="/">
                <img src="/static/favicon.png">
                <span>技术文章摘抄</span>
            </a>
        </div>
        <div class="book-menu uncollapsible">
            <ul class="uncollapsible">
                <li><a href="/" class="current-tab">首页</a></li>
            </ul>
            <ul class="uncollapsible">
                <li><a href="../">上一级</a></li>
            </ul>
            <ul class="uncollapsible">
                <li>
                    <a href="/专栏/MySQL实战45讲/00 开篇词  这一次，让我们一起来搞懂MySQL.md.html">00 开篇词  这一次，让我们一起来搞懂MySQL</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/01  基础架构：一条SQL查询语句是如何执行的？.md.html">01  基础架构：一条SQL查询语句是如何执行的？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/02  日志系统：一条SQL更新语句是如何执行的？.md.html">02  日志系统：一条SQL更新语句是如何执行的？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/03  事务隔离：为什么你改了我还看不见？.md.html">03  事务隔离：为什么你改了我还看不见？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/04  深入浅出索引（上）.md.html">04  深入浅出索引（上）</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/05  深入浅出索引（下）.md.html">05  深入浅出索引（下）</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/06  全局锁和表锁 ：给表加个字段怎么有这么多阻碍？.md.html">06  全局锁和表锁 ：给表加个字段怎么有这么多阻碍？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/07  行锁功过：怎么减少行锁对性能的影响？.md.html">07  行锁功过：怎么减少行锁对性能的影响？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/08  事务到底是隔离的还是不隔离的？.md.html">08  事务到底是隔离的还是不隔离的？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/09  普通索引和唯一索引，应该怎么选择？.md.html">09  普通索引和唯一索引，应该怎么选择？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/10  MySQL为什么有时候会选错索引？.md.html">10  MySQL为什么有时候会选错索引？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/11  怎么给字符串字段加索引？.md.html">11  怎么给字符串字段加索引？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/12  为什么我的MySQL会“抖”一下？.md.html">12  为什么我的MySQL会“抖”一下？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/13  为什么表数据删掉一半，表文件大小不变？.md.html">13  为什么表数据删掉一半，表文件大小不变？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/14  count()这么慢，我该怎么办？.md.html">14  count()这么慢，我该怎么办？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/15  答疑文章（一）：日志和索引相关问题.md.html">15  答疑文章（一）：日志和索引相关问题</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/16  “order by”是怎么工作的？.md.html">16  “order by”是怎么工作的？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/17  如何正确地显示随机消息？.md.html">17  如何正确地显示随机消息？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/18  为什么这些SQL语句逻辑相同，性能却差异巨大？.md.html">18  为什么这些SQL语句逻辑相同，性能却差异巨大？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/19  为什么我只查一行的语句，也执行这么慢？.md.html">19  为什么我只查一行的语句，也执行这么慢？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/20  幻读是什么，幻读有什么问题？.md.html">20  幻读是什么，幻读有什么问题？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/21  为什么我只改一行的语句，锁这么多？.md.html">21  为什么我只改一行的语句，锁这么多？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/22  MySQL有哪些“饮鸩止渴”提高性能的方法？.md.html">22  MySQL有哪些“饮鸩止渴”提高性能的方法？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/23  MySQL是怎么保证数据不丢的？.md.html">23  MySQL是怎么保证数据不丢的？</a>
                </li>
                <li>
                    <a class="current-tab" href="/专栏/MySQL实战45讲/24  MySQL是怎么保证主备一致的？.md.html">24  MySQL是怎么保证主备一致的？</a>

                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/25  MySQL是怎么保证高可用的？.md.html">25  MySQL是怎么保证高可用的？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/26  备库为什么会延迟好几个小时？.md.html">26  备库为什么会延迟好几个小时？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/27  主库出问题了，从库怎么办？.md.html">27  主库出问题了，从库怎么办？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/28  读写分离有哪些坑？.md.html">28  读写分离有哪些坑？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/29  如何判断一个数据库是不是出问题了？.md.html">29  如何判断一个数据库是不是出问题了？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/30  答疑文章（二）：用动态的观点看加锁.md.html">30  答疑文章（二）：用动态的观点看加锁</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/31  误删数据后除了跑路，还能怎么办？.md.html">31  误删数据后除了跑路，还能怎么办？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/32  为什么还有kill不掉的语句？.md.html">32  为什么还有kill不掉的语句？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/33  我查这么多数据，会不会把数据库内存打爆？.md.html">33  我查这么多数据，会不会把数据库内存打爆？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/34  到底可不可以使用join？.md.html">34  到底可不可以使用join？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/35  join语句怎么优化？.md.html">35  join语句怎么优化？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/36  为什么临时表可以重名？.md.html">36  为什么临时表可以重名？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/37  什么时候会使用内部临时表？.md.html">37  什么时候会使用内部临时表？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/38  都说InnoDB好，那还要不要使用Memory引擎？.md.html">38  都说InnoDB好，那还要不要使用Memory引擎？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/39  自增主键为什么不是连续的？.md.html">39  自增主键为什么不是连续的？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/40  insert语句的锁为什么这么多？.md.html">40  insert语句的锁为什么这么多？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/41  怎么最快地复制一张表？.md.html">41  怎么最快地复制一张表？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/42  grant之后要跟着flush privileges吗？.md.html">42  grant之后要跟着flush privileges吗？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/43  要不要使用分区表？.md.html">43  要不要使用分区表？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/44  答疑文章（三）：说一说这些好问题.md.html">44  答疑文章（三）：说一说这些好问题</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/45  自增id用完怎么办？.md.html">45  自增id用完怎么办？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/我的MySQL心路历程.md.html">我的MySQL心路历程</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/结束语  点线网面，一起构建MySQL知识网络.md.html">结束语  点线网面，一起构建MySQL知识网络</a>
                </li>
            </ul>
        </div>
    </div>
    <div class="sidebar-toggle" onclick="sidebar_toggle()" onmouseover="add_inner()" onmouseleave="remove_inner()">
        <div class="sidebar-toggle-inner"></div>
    </div>
    <script>
        function add_inner() {
            let inner = document.querySelector('.sidebar-toggle-inner')
            inner.classList.add('show')
        }
        function remove_inner() {
            let inner = document.querySelector('.sidebar-toggle-inner')
            inner.classList.remove('show')
        }
        function sidebar_toggle() {
            let sidebar_toggle = document.querySelector('.sidebar-toggle')
            let sidebar = document.querySelector('.book-sidebar')
            let content = document.querySelector('.off-canvas-content')
            if (sidebar_toggle.classList.contains('extend')) { // show
                sidebar_toggle.classList.remove('extend')
                sidebar.classList.remove('hide')
                content.classList.remove('extend')
            } else { // hide
                sidebar_toggle.classList.add('extend')
                sidebar.classList.add('hide')
                content.classList.add('extend')
            }
        }
function open_sidebar() {
    let sidebar = document.querySelector('.book-sidebar')
    let overlay = document.querySelector('.off-canvas-overlay')
    sidebar.classList.add('show')
    overlay.classList.add('show')
}
function hide_canvas() {
    let sidebar = document.querySelector('.book-sidebar')
    let overlay = document.querySelector('.off-canvas-overlay')
    sidebar.classList.remove('show')
    overlay.classList.remove('show')
}
    </script>
    <div class="off-canvas-content">
        <div class="columns">
            <div class="column col-12 col-lg-12">
                <div class="book-navbar">
                    <!-- For Responsive Layout -->
                    <header class="navbar">
                        <section class="navbar-section">
                            <a onclick="open_sidebar()">
                                <i class="icon icon-menu"></i>
                            </a>
                        </section>
                    </header>
                </div>
                <div class="book-content" style="max-width: 960px; margin: 0 auto;
    overflow-x: auto;
    overflow-y: hidden;">
                    <div class="book-post">
                        <p id="tip" align="center"></p>
                        <div><h1>24  MySQL是怎么保证主备一致的？</h1>
<p>在前面的文章中，我不止一次地和你提到了 binlog，大家知道 binlog 可以用来归档，也可以用来做主备同步，但它的内容是什么样的呢？为什么备库执行了 binlog 就可以跟主库保持一致了呢？今天我就正式地和你介绍一下它。</p>
<p>毫不夸张地说，MySQL 能够成为现下最流行的开源数据库，binlog 功不可没。</p>
<p>在最开始，MySQL 是以容易学习和方便的高可用架构，被开发人员青睐的。而它的几乎所有的高可用架构，都直接依赖于 binlog。虽然这些高可用架构已经呈现出越来越复杂的趋势，但都是从最基本的一主一备演化过来的。</p>
<p>今天这篇文章我主要为你介绍主备的基本原理。理解了背后的设计原理，你也可以从业务开发的角度，来借鉴这些设计思想。</p>
<h1>MySQL 主备的基本原理</h1>
<p>如图 1 所示就是基本的主备切换流程。</p>
<p><img src="assets/fd75a2b37ae6ca709b7f16fe060c2c10.png" alt="img" /></p>
<p>图 1 MySQL 主备切换流程</p>
<p>在状态 1 中，客户端的读写都直接访问节点 A，而节点 B 是 A 的备库，只是将 A 的更新都同步过来，到本地执行。这样可以保持节点 B 和 A 的数据是相同的。</p>
<p>当需要切换的时候，就切成状态 2。这时候客户端读写访问的都是节点 B，而节点 A 是 B 的备库。</p>
<p>在状态 1 中，虽然节点 B 没有被直接访问，但是我依然建议你把节点 B（也就是备库）设置成只读（readonly）模式。这样做，有以下几个考虑：</p>
<ol>
<li>有时候一些运营类的查询语句会被放到备库上去查，设置为只读可以防止误操作；</li>
<li>防止切换逻辑有 bug，比如切换过程中出现双写，造成主备不一致；</li>
<li>可以用 readonly 状态，来判断节点的角色。</li>
</ol>
<p>你可能会问，我把备库设置成只读了，还怎么跟主库保持同步更新呢？</p>
<p>这个问题，你不用担心。因为 readonly 设置对超级 (super) 权限用户是无效的，而用于同步更新的线程，就拥有超级权限。</p>
<p>接下来，我们再看看<strong>节点 A 到 B 这条线的内部流程是什么样的</strong>。图 2 中画出的就是一个 update 语句在节点 A 执行，然后同步到节点 B 的完整流程图。</p>
<p><img src="assets/a66c154c1bc51e071dd2cc8c1d6ca6a3.png" alt="img" /></p>
<p>图 2 主备流程图</p>
<p>图 2 中，包含了我在上一篇文章中讲到的 binlog 和 redo log 的写入机制相关的内容，可以看到：主库接收到客户端的更新请求后，执行内部事务的更新逻辑，同时写 binlog。</p>
<p>备库 B 跟主库 A 之间维持了一个长连接。主库 A 内部有一个线程，专门用于服务备库 B 的这个长连接。一个事务日志同步的完整过程是这样的：</p>
<ol>
<li>在备库 B 上通过 change master 命令，设置主库 A 的 IP、端口、用户名、密码，以及要从哪个位置开始请求 binlog，这个位置包含文件名和日志偏移量。</li>
<li>在备库 B 上执行 start slave 命令，这时候备库会启动两个线程，就是图中的 io_thread 和 sql_thread。其中 io_thread 负责与主库建立连接。</li>
<li>主库 A 校验完用户名、密码后，开始按照备库 B 传过来的位置，从本地读取 binlog，发给 B。</li>
<li>备库 B 拿到 binlog 后，写到本地文件，称为中转日志（relay log）。</li>
<li>sql_thread 读取中转日志，解析出日志里的命令，并执行。</li>
</ol>
<p>这里需要说明，后来由于多线程复制方案的引入，sql_thread 演化成为了多个线程，跟我们今天要介绍的原理没有直接关系，暂且不展开。</p>
<p>分析完了这个长连接的逻辑，我们再来看一个问题：binlog 里面到底是什么内容，为什么备库拿过去可以直接执行。</p>
<h1>binlog 的三种格式对比</h1>
<p>我在[第 15 篇答疑文章]中，和你提到过 binlog 有两种格式，一种是 statement，一种是 row。可能你在其他资料上还会看到有第三种格式，叫作 mixed，其实它就是前两种格式的混合。</p>
<p>为了便于描述 binlog 的这三种格式间的区别，我创建了一个表，并初始化几行数据。</p>
<pre><code>mysql&gt; CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  `a` int(11) DEFAULT NULL,
  `t_modified` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`),
  KEY `a` (`a`),
  KEY `t_modified`(`t_modified`)
) ENGINE=InnoDB;

insert into t values(1,1,'2018-11-13');
insert into t values(2,2,'2018-11-12');
insert into t values(3,3,'2018-11-11');
insert into t values(4,4,'2018-11-10');
insert into t values(5,5,'2018-11-09');
</code></pre>
<p>如果要在表中删除一行数据的话，我们来看看这个 delete 语句的 binlog 是怎么记录的。</p>
<p>注意，下面这个语句包含注释，如果你用 MySQL 客户端来做这个实验的话，要记得加 -c 参数，否则客户端会自动去掉注释。</p>
<pre><code>mysql&gt; delete from t /*comment*/  where a&gt;=4 and t_modified&lt;='2018-11-10' limit 1;
</code></pre>
<p>当 binlog_format=statement 时，binlog 里面记录的就是 SQL 语句的原文。你可以用</p>
<pre><code>mysql&gt; show binlog events in 'master.000001';
</code></pre>
<p>命令看 binlog 中的内容。</p>
<p><img src="assets/b9818f73cd7d38a96ddcb75350b52931.png" alt="img" /></p>
<p>图 3 statement 格式 binlog 示例</p>
<p>现在，我们来看一下图 3 的输出结果。</p>
<ul>
<li>第一行 SET @@SESSION.GTID_NEXT='ANONYMOUS’你可以先忽略，后面文章我们会在介绍主备切换的时候再提到；</li>
<li>第二行是一个 BEGIN，跟第四行的 commit 对应，表示中间是一个事务；</li>
<li>第三行就是真实执行的语句了。可以看到，在真实执行的 delete 命令之前，还有一个“use ‘test’”命令。这条命令不是我们主动执行的，而是 MySQL 根据当前要操作的表所在的数据库，自行添加的。这样做可以保证日志传到备库去执行的时候，不论当前的工作线程在哪个库里，都能够正确地更新到 test 库的表 t。
use 'test’命令之后的 delete 语句，就是我们输入的 SQL 原文了。可以看到，binlog“忠实”地记录了 SQL 命令，甚至连注释也一并记录了。</li>
<li>最后一行是一个 COMMIT。你可以看到里面写着 xid=61。你还记得这个 XID 是做什么用的吗？如果记忆模糊了，可以再回顾一下[第 15 篇文章]中的相关内容。</li>
</ul>
<p>为了说明 statement 和 row 格式的区别，我们来看一下这条 delete 命令的执行效果图：</p>
<p><img src="assets/96c2be9c0fcbff66883118526b26652b.png" alt="img" /></p>
<p>图 4 delete 执行 warnings</p>
<p>可以看到，运行这条 delete 命令产生了一个 warning，原因是当前 binlog 设置的是 statement 格式，并且语句中有 limit，所以这个命令可能是 unsafe 的。</p>
<p>为什么这么说呢？这是因为 delete 带 limit，很可能会出现主备数据不一致的情况。比如上面这个例子：</p>
<ol>
<li>如果 delete 语句使用的是索引 a，那么会根据索引 a 找到第一个满足条件的行，也就是说删除的是 a=4 这一行；</li>
<li>但如果使用的是索引 t_modified，那么删除的就是 t_modified='2018-11-09’也就是 a=5 这一行。</li>
</ol>
<p>由于 statement 格式下，记录到 binlog 里的是语句原文，因此可能会出现这样一种情况：在主库执行这条 SQL 语句的时候，用的是索引 a；而在备库执行这条 SQL 语句的时候，却使用了索引 t_modified。因此，MySQL 认为这样写是有风险的。</p>
<p>那么，如果我把 binlog 的格式改为 binlog_format=‘row’， 是不是就没有这个问题了呢？我们先来看看这时候 binog 中的内容吧。</p>
<p><img src="assets/d67a38db154afff610ae3bb64e266826.png" alt="img" /></p>
<p>图 5 row 格式 binlog 示例</p>
<p>可以看到，与 statement 格式的 binlog 相比，前后的 BEGIN 和 COMMIT 是一样的。但是，row 格式的 binlog 里没有了 SQL 语句的原文，而是替换成了两个 event：Table_map 和 Delete_rows。</p>
<ol>
<li>Table_map event，用于说明接下来要操作的表是 test 库的表 t;</li>
<li>Delete_rows event，用于定义删除的行为。</li>
</ol>
<p>其实，我们通过图 5 是看不到详细信息的，还需要借助 mysqlbinlog 工具，用下面这个命令解析和查看 binlog 中的内容。因为图 5 中的信息显示，这个事务的 binlog 是从 8900 这个位置开始的，所以可以用 start-position 参数来指定从这个位置的日志开始解析。</p>
<pre><code>mysqlbinlog  -vv data/master.000001 --start-position=8900;
</code></pre>
<p><img src="assets/c342cf480d23b05d30a294b114cebfc2.png" alt="img" /></p>
<p>图 6 row 格式 binlog 示例的详细信息</p>
<p>从这个图中，我们可以看到以下几个信息：</p>
<ul>
<li>server id 1，表示这个事务是在 server_id=1 的这个库上执行的。</li>
<li>每个 event 都有 CRC32 的值，这是因为我把参数 binlog_checksum 设置成了 CRC32。</li>
<li>Table_map event 跟在图 5 中看到的相同，显示了接下来要打开的表，map 到数字 226。现在我们这条 SQL 语句只操作了一张表，如果要操作多张表呢？每个表都有一个对应的 Table_map event、都会 map 到一个单独的数字，用于区分对不同表的操作。</li>
<li>我们在 mysqlbinlog 的命令中，使用了 -vv 参数是为了把内容都解析出来，所以从结果里面可以看到各个字段的值（比如，@1=4、 @2=4 这些值）。</li>
<li>binlog_row_image 的默认配置是 FULL，因此 Delete_event 里面，包含了删掉的行的所有字段的值。如果把 binlog_row_image 设置为 MINIMAL，则只会记录必要的信息，在这个例子里，就是只会记录 id=4 这个信息。</li>
<li>最后的 Xid event，用于表示事务被正确地提交了。</li>
</ul>
<p>你可以看到，当 binlog_format 使用 row 格式的时候，binlog 里面记录了真实删除行的主键 id，这样 binlog 传到备库去的时候，就肯定会删除 id=4 的行，不会有主备删除不同行的问题。</p>
<h1>为什么会有 mixed 格式的 binlog？</h1>
<p>基于上面的信息，我们来讨论一个问题：**为什么会有 mixed 这种 binlog 格式的存在场景？**推论过程是这样的：</p>
<ul>
<li>因为有些 statement 格式的 binlog 可能会导致主备不一致，所以要使用 row 格式。</li>
<li>但 row 格式的缺点是，很占空间。比如你用一个 delete 语句删掉 10 万行数据，用 statement 的话就是一个 SQL 语句被记录到 binlog 中，占用几十个字节的空间。但如果用 row 格式的 binlog，就要把这 10 万条记录都写到 binlog 中。这样做，不仅会占用更大的空间，同时写 binlog 也要耗费 IO 资源，影响执行速度。</li>
<li>所以，MySQL 就取了个折中方案，也就是有了 mixed 格式的 binlog。mixed 格式的意思是，MySQL 自己会判断这条 SQL 语句是否可能引起主备不一致，如果有可能，就用 row 格式，否则就用 statement 格式。</li>
</ul>
<p>也就是说，mixed 格式可以利用 statment 格式的优点，同时又避免了数据不一致的风险。</p>
<p>因此，如果你的线上 MySQL 设置的 binlog 格式是 statement 的话，那基本上就可以认为这是一个不合理的设置。你至少应该把 binlog 的格式设置为 mixed。</p>
<p>比如我们这个例子，设置为 mixed 后，就会记录为 row 格式；而如果执行的语句去掉 limit 1，就会记录为 statement 格式。</p>
<p>当然我要说的是，现在越来越多的场景要求把 MySQL 的 binlog 格式设置成 row。这么做的理由有很多，我来给你举一个可以直接看出来的好处：<strong>恢复数据</strong>。</p>
<p>接下来，我们就分别从 delete、insert 和 update 这三种 SQL 语句的角度，来看看数据恢复的问题。</p>
<p>通过图 6 你可以看出来，即使我执行的是 delete 语句，row 格式的 binlog 也会把被删掉的行的整行信息保存起来。所以，如果你在执行完一条 delete 语句以后，发现删错数据了，可以直接把 binlog 中记录的 delete 语句转成 insert，把被错删的数据插入回去就可以恢复了。</p>
<p>如果你是执行错了 insert 语句呢？那就更直接了。row 格式下，insert 语句的 binlog 里会记录所有的字段信息，这些信息可以用来精确定位刚刚被插入的那一行。这时，你直接把 insert 语句转成 delete 语句，删除掉这被误插入的一行数据就可以了。</p>
<p>如果执行的是 update 语句的话，binlog 里面会记录修改前整行的数据和修改后的整行数据。所以，如果你误执行了 update 语句的话，只需要把这个 event 前后的两行信息对调一下，再去数据库里面执行，就能恢复这个更新操作了。</p>
<p>其实，由 delete、insert 或者 update 语句导致的数据操作错误，需要恢复到操作之前状态的情况，也时有发生。MariaDB 的<a href="https://mariadb.com/kb/en/library/flashback/">Flashback</a>工具就是基于上面介绍的原理来回滚数据的。</p>
<p>虽然 mixed 格式的 binlog 现在已经用得不多了，但这里我还是要再借用一下 mixed 格式来说明一个问题，来看一下这条 SQL 语句：</p>
<pre><code>mysql&gt; insert into t values(10,10, now());
</code></pre>
<p>如果我们把 binlog 格式设置为 mixed，你觉得 MySQL 会把它记录为 row 格式还是 statement 格式呢？</p>
<p>先不要着急说结果，我们一起来看一下这条语句执行的效果。</p>
<p><img src="assets/0150301698979255a6f27711c35e9eef.png" alt="img" /></p>
<p>图 7 mixed 格式和 now()</p>
<p>可以看到，MySQL 用的居然是 statement 格式。你一定会奇怪，如果这个 binlog 过了 1 分钟才传给备库的话，那主备的数据不就不一致了吗？</p>
<p>接下来，我们再用 mysqlbinlog 工具来看看：</p>
<p><img src="assets/1ad3a4c4b9a71955edba5195757dd041.png" alt="img" /></p>
<p>图 8 TIMESTAMP 命令</p>
<p>从图中的结果可以看到，原来 binlog 在记录 event 的时候，多记了一条命令：SET TIMESTAMP=1546103491。它用 SET TIMESTAMP 命令约定了接下来的 now() 函数的返回时间。</p>
<p>因此，不论这个 binlog 是 1 分钟之后被备库执行，还是 3 天后用来恢复这个库的备份，这个 insert 语句插入的行，值都是固定的。也就是说，通过这条 SET TIMESTAMP 命令，MySQL 就确保了主备数据的一致性。</p>
<p>我之前看过有人在重放 binlog 数据的时候，是这么做的：用 mysqlbinlog 解析出日志，然后把里面的 statement 语句直接拷贝出来执行。</p>
<p>你现在知道了，这个方法是有风险的。因为有些语句的执行结果是依赖于上下文命令的，直接执行的结果很可能是错误的。</p>
<p>所以，用 binlog 来恢复数据的标准做法是，用 mysqlbinlog 工具解析出来，然后把解析结果整个发给 MySQL 执行。类似下面的命令：</p>
<pre><code>mysqlbinlog master.000001  --start-position=2738 --stop-position=2973 | mysql -h127.0.0.1 -P13000 -u$user -p$pwd;
</code></pre>
<p>这个命令的意思是，将 master.000001 文件里面从第 2738 字节到第 2973 字节中间这段内容解析出来，放到 MySQL 去执行。</p>
<h1>循环复制问题</h1>
<p>通过上面对 MySQL 中 binlog 基本内容的理解，你现在可以知道，binlog 的特性确保了在备库执行相同的 binlog，可以得到与主库相同的状态。</p>
<p>因此，我们可以认为正常情况下主备的数据是一致的。也就是说，图 1 中 A、B 两个节点的内容是一致的。其实，图 1 中我画的是 M-S 结构，但实际生产上使用比较多的是双 M 结构，也就是图 9 所示的主备切换流程。</p>
<p><img src="assets/20ad4e163115198dc6cf372d5116c956.png" alt="img" /></p>
<p>图 9 MySQL 主备切换流程 -- 双 M 结构</p>
<p>对比图 9 和图 1，你可以发现，双 M 结构和 M-S 结构，其实区别只是多了一条线，即：节点 A 和 B 之间总是互为主备关系。这样在切换的时候就不用再修改主备关系。</p>
<p>但是，双 M 结构还有一个问题需要解决。</p>
<p>业务逻辑在节点 A 上更新了一条语句，然后再把生成的 binlog 发给节点 B，节点 B 执行完这条更新语句后也会生成 binlog。（我建议你把参数 log_slave_updates 设置为 on，表示备库执行 relay log 后生成 binlog）。</p>
<p>那么，如果节点 A 同时是节点 B 的备库，相当于又把节点 B 新生成的 binlog 拿过来执行了一次，然后节点 A 和 B 间，会不断地循环执行这个更新语句，也就是循环复制了。这个要怎么解决呢？</p>
<p>从上面的图 6 中可以看到，MySQL 在 binlog 中记录了这个命令第一次执行时所在实例的 server id。因此，我们可以用下面的逻辑，来解决两个节点间的循环复制的问题：</p>
<ol>
<li>规定两个库的 server id 必须不同，如果相同，则它们之间不能设定为主备关系；</li>
<li>一个备库接到 binlog 并在重放的过程中，生成与原 binlog 的 server id 相同的新的 binlog；</li>
<li>每个库在收到从自己的主库发过来的日志后，先判断 server id，如果跟自己的相同，表示这个日志是自己生成的，就直接丢弃这个日志。</li>
</ol>
<p>按照这个逻辑，如果我们设置了双 M 结构，日志的执行流就会变成这样：</p>
<ol>
<li>从节点 A 更新的事务，binlog 里面记的都是 A 的 server id；</li>
<li>传到节点 B 执行一次以后，节点 B 生成的 binlog 的 server id 也是 A 的 server id；</li>
<li>再传回给节点 A，A 判断到这个 server id 与自己的相同，就不会再处理这个日志。所以，死循环在这里就断掉了。</li>
</ol>
<h1>小结</h1>
<p>今天这篇文章，我给你介绍了 MySQL binlog 的格式和一些基本机制，是后面我要介绍的读写分离等系列文章的背景知识，希望你可以认真消化理解。</p>
<p>binlog 在 MySQL 的各种高可用方案上扮演了重要角色。今天介绍的可以说是所有 MySQL 高可用方案的基础。在这之上演化出了诸如多节点、半同步、MySQL group replication 等相对复杂的方案。</p>
<p>我也跟你介绍了 MySQL 不同格式 binlog 的优缺点，和设计者的思考。希望你在做系统开发时候，也能借鉴这些设计思想。</p>
<p>最后，我给你留下一个思考题吧。</p>
<p>说到循环复制问题的时候，我们说 MySQL 通过判断 server id 的方式，断掉死循环。但是，这个机制其实并不完备，在某些场景下，还是有可能出现死循环。</p>
<p>你能构造出一个这样的场景吗？又应该怎么解决呢？</p>
<p>你可以把你的设计和分析写在评论区，我会在下一篇文章跟你讨论这个问题。感谢你的收听，也欢迎你把这篇文章分享给更多的朋友一起阅读。</p>
<h1>上期问题时间</h1>
<p>上期我留给你的问题是，你在什么时候会把线上生产库设置成“非双 1”。我目前知道的场景，有以下这些：</p>
<ol>
<li>业务高峰期。一般如果有预知的高峰期，DBA 会有预案，把主库设置成“非双 1”。</li>
<li>备库延迟，为了让备库尽快赶上主库。@永恒记忆和 @Second Sight 提到了这个场景。</li>
<li>用备份恢复主库的副本，应用 binlog 的过程，这个跟上一种场景类似。</li>
<li>批量导入数据的时候。</li>
</ol>
<p>一般情况下，把生产库改成“非双 1”配置，是设置 innodb_flush_logs_at_trx_commit=2、sync_binlog=1000。</p>
</div>
                    </div>
                    <div>
                        <div style="float: left">
                            <a href="/专栏/MySQL实战45讲/23  MySQL是怎么保证数据不丢的？.md.html">上一页</a>
                        </div>
                        <div style="float: right">
                            <a href="/专栏/MySQL实战45讲/25  MySQL是怎么保证高可用的？.md.html">下一页</a>
                        </div>
                    </div>
                </div>
            </div>
        </div>
    </div>
    <a class="off-canvas-overlay" onclick="hide_canvas()"></a>
</div>
<script defer src="https://static.cloudflareinsights.com/beacon.min.js/v652eace1692a40cfa3763df669d7439c1639079717194" integrity="sha512-Gi7xpJR8tSkrpF7aordPZQlW2DLtzUlZcumS8dMQjwDHEnw9I7ZLyiOj/6tZStRBGtGgN6ceN6cMH8z7etPGlw==" data-cf-beacon='{"rayId":"709972bcdd003d60","version":"2021.12.0","r":1,"token":"1f5d475227ce4f0089a7cff1ab17c0f5","si":100}' crossorigin="anonymous"></script>
</body>
<!-- Global site tag (gtag.js) - Google Analytics -->
<script async src="https://www.googletagmanager.com/gtag/js?id=G-NPSEEVD756"></script>
<script>
    window.dataLayer = window.dataLayer || [];
    function gtag() {
        dataLayer.push(arguments);
    }
    gtag('js', new Date());
    gtag('config', 'G-NPSEEVD756');
    var path = window.location.pathname
    var cookie = getCookie("lastPath");
    console.log(path)
    if (path.replace("/", "") === "") {
        if (cookie.replace("/", "") !== "") {
            console.log(cookie)
            document.getElementById("tip").innerHTML = "<a href='" + cookie + "'>跳转到上次进度</a>"
        }
    } else {
        setCookie("lastPath", path)
    }
    function setCookie(cname, cvalue) {
        var d = new Date();
        d.setTime(d.getTime() + (180 * 24 * 60 * 60 * 1000));
        var expires = "expires=" + d.toGMTString();
        document.cookie = cname + "=" + cvalue + "; " + expires + ";path = /";
    }
    function getCookie(cname) {
        var name = cname + "=";
        var ca = document.cookie.split(';');
        for (var i = 0; i < ca.length; i++) {
            var c = ca[i].trim();
            if (c.indexOf(name) === 0) return c.substring(name.length, c.length);
        }
        return "";
    }
</script>
</html>