learn.lianglianglee.com/专栏/MySQL实战45讲/09 普通索引和唯一索引，应该怎么选择？.md.html

<!DOCTYPE html>
<!-- saved from url=(0046)https://kaiiiz.github.io/hexo-theme-book-demo/ -->
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
        <meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1.0, user-scalable=no">
        <link rel="icon" href="/static/favicon.png">
        <title>09  普通索引和唯一索引，应该怎么选择？.md.html</title>
        <!-- Spectre.css framework -->
        <link rel="stylesheet" href="/static/index.css">
        <!-- theme css & js -->
        <meta name="generator" content="Hexo 4.2.0">
    </head>
<body>
<div class="book-container">
    <div class="book-sidebar">
        <div class="book-brand">
            <a href="/">
                <img src="/static/favicon.png">
                <span>技术文章摘抄</span>
            </a>
        </div>
        <div class="book-menu uncollapsible">
            <ul class="uncollapsible">
                <li><a href="/" class="current-tab">首页</a></li>
            </ul>
            <ul class="uncollapsible">
                <li><a href="../">上一级</a></li>
            </ul>
            <ul class="uncollapsible">
                <li>
                    <a href="/专栏/MySQL实战45讲/00 开篇词  这一次，让我们一起来搞懂MySQL.md.html">00 开篇词  这一次，让我们一起来搞懂MySQL</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/01  基础架构：一条SQL查询语句是如何执行的？.md.html">01  基础架构：一条SQL查询语句是如何执行的？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/02  日志系统：一条SQL更新语句是如何执行的？.md.html">02  日志系统：一条SQL更新语句是如何执行的？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/03  事务隔离：为什么你改了我还看不见？.md.html">03  事务隔离：为什么你改了我还看不见？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/04  深入浅出索引（上）.md.html">04  深入浅出索引（上）</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/05  深入浅出索引（下）.md.html">05  深入浅出索引（下）</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/06  全局锁和表锁 ：给表加个字段怎么有这么多阻碍？.md.html">06  全局锁和表锁 ：给表加个字段怎么有这么多阻碍？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/07  行锁功过：怎么减少行锁对性能的影响？.md.html">07  行锁功过：怎么减少行锁对性能的影响？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/08  事务到底是隔离的还是不隔离的？.md.html">08  事务到底是隔离的还是不隔离的？</a>
                </li>
                <li>
                    <a class="current-tab" href="/专栏/MySQL实战45讲/09  普通索引和唯一索引，应该怎么选择？.md.html">09  普通索引和唯一索引，应该怎么选择？</a>

                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/10  MySQL为什么有时候会选错索引？.md.html">10  MySQL为什么有时候会选错索引？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/11  怎么给字符串字段加索引？.md.html">11  怎么给字符串字段加索引？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/12  为什么我的MySQL会“抖”一下？.md.html">12  为什么我的MySQL会“抖”一下？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/13  为什么表数据删掉一半，表文件大小不变？.md.html">13  为什么表数据删掉一半，表文件大小不变？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/14  count()这么慢，我该怎么办？.md.html">14  count()这么慢，我该怎么办？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/15  答疑文章（一）：日志和索引相关问题.md.html">15  答疑文章（一）：日志和索引相关问题</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/16  “order by”是怎么工作的？.md.html">16  “order by”是怎么工作的？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/17  如何正确地显示随机消息？.md.html">17  如何正确地显示随机消息？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/18  为什么这些SQL语句逻辑相同，性能却差异巨大？.md.html">18  为什么这些SQL语句逻辑相同，性能却差异巨大？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/19  为什么我只查一行的语句，也执行这么慢？.md.html">19  为什么我只查一行的语句，也执行这么慢？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/20  幻读是什么，幻读有什么问题？.md.html">20  幻读是什么，幻读有什么问题？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/21  为什么我只改一行的语句，锁这么多？.md.html">21  为什么我只改一行的语句，锁这么多？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/22  MySQL有哪些“饮鸩止渴”提高性能的方法？.md.html">22  MySQL有哪些“饮鸩止渴”提高性能的方法？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/23  MySQL是怎么保证数据不丢的？.md.html">23  MySQL是怎么保证数据不丢的？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/24  MySQL是怎么保证主备一致的？.md.html">24  MySQL是怎么保证主备一致的？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/25  MySQL是怎么保证高可用的？.md.html">25  MySQL是怎么保证高可用的？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/26  备库为什么会延迟好几个小时？.md.html">26  备库为什么会延迟好几个小时？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/27  主库出问题了，从库怎么办？.md.html">27  主库出问题了，从库怎么办？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/28  读写分离有哪些坑？.md.html">28  读写分离有哪些坑？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/29  如何判断一个数据库是不是出问题了？.md.html">29  如何判断一个数据库是不是出问题了？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/30  答疑文章（二）：用动态的观点看加锁.md.html">30  答疑文章（二）：用动态的观点看加锁</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/31  误删数据后除了跑路，还能怎么办？.md.html">31  误删数据后除了跑路，还能怎么办？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/32  为什么还有kill不掉的语句？.md.html">32  为什么还有kill不掉的语句？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/33  我查这么多数据，会不会把数据库内存打爆？.md.html">33  我查这么多数据，会不会把数据库内存打爆？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/34  到底可不可以使用join？.md.html">34  到底可不可以使用join？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/35  join语句怎么优化？.md.html">35  join语句怎么优化？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/36  为什么临时表可以重名？.md.html">36  为什么临时表可以重名？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/37  什么时候会使用内部临时表？.md.html">37  什么时候会使用内部临时表？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/38  都说InnoDB好，那还要不要使用Memory引擎？.md.html">38  都说InnoDB好，那还要不要使用Memory引擎？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/39  自增主键为什么不是连续的？.md.html">39  自增主键为什么不是连续的？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/40  insert语句的锁为什么这么多？.md.html">40  insert语句的锁为什么这么多？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/41  怎么最快地复制一张表？.md.html">41  怎么最快地复制一张表？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/42  grant之后要跟着flush privileges吗？.md.html">42  grant之后要跟着flush privileges吗？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/43  要不要使用分区表？.md.html">43  要不要使用分区表？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/44  答疑文章（三）：说一说这些好问题.md.html">44  答疑文章（三）：说一说这些好问题</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/45  自增id用完怎么办？.md.html">45  自增id用完怎么办？</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/我的MySQL心路历程.md.html">我的MySQL心路历程</a>
                </li>
                <li>
                    <a href="/专栏/MySQL实战45讲/结束语  点线网面，一起构建MySQL知识网络.md.html">结束语  点线网面，一起构建MySQL知识网络</a>
                </li>
            </ul>
        </div>
    </div>
    <div class="sidebar-toggle" onclick="sidebar_toggle()" onmouseover="add_inner()" onmouseleave="remove_inner()">
        <div class="sidebar-toggle-inner"></div>
    </div>
    <script>
        function add_inner() {
            let inner = document.querySelector('.sidebar-toggle-inner')
            inner.classList.add('show')
        }
        function remove_inner() {
            let inner = document.querySelector('.sidebar-toggle-inner')
            inner.classList.remove('show')
        }
        function sidebar_toggle() {
            let sidebar_toggle = document.querySelector('.sidebar-toggle')
            let sidebar = document.querySelector('.book-sidebar')
            let content = document.querySelector('.off-canvas-content')
            if (sidebar_toggle.classList.contains('extend')) { // show
                sidebar_toggle.classList.remove('extend')
                sidebar.classList.remove('hide')
                content.classList.remove('extend')
            } else { // hide
                sidebar_toggle.classList.add('extend')
                sidebar.classList.add('hide')
                content.classList.add('extend')
            }
        }
function open_sidebar() {
    let sidebar = document.querySelector('.book-sidebar')
    let overlay = document.querySelector('.off-canvas-overlay')
    sidebar.classList.add('show')
    overlay.classList.add('show')
}
function hide_canvas() {
    let sidebar = document.querySelector('.book-sidebar')
    let overlay = document.querySelector('.off-canvas-overlay')
    sidebar.classList.remove('show')
    overlay.classList.remove('show')
}
    </script>
    <div class="off-canvas-content">
        <div class="columns">
            <div class="column col-12 col-lg-12">
                <div class="book-navbar">
                    <!-- For Responsive Layout -->
                    <header class="navbar">
                        <section class="navbar-section">
                            <a onclick="open_sidebar()">
                                <i class="icon icon-menu"></i>
                            </a>
                        </section>
                    </header>
                </div>
                <div class="book-content" style="max-width: 960px; margin: 0 auto;
    overflow-x: auto;
    overflow-y: hidden;">
                    <div class="book-post">
                        <p id="tip" align="center"></p>
                        <div><h1>09  普通索引和唯一索引，应该怎么选择？</h1>
<p>今天的正文开始前，我要特意感谢一下评论区几位留下高质量留言的同学。</p>
<p>用户名是 @某、人 的同学，对文章的知识点做了梳理，然后提了关于事务可见性的问题，就是先启动但是后提交的事务，对数据可见性的影响。@夏日雨同学也提到了这个问题，我在置顶评论中回复了，今天的文章末尾也会再展开说明。@Justin 和 @倪大人两位同学提了两个好问题。</p>
<p>对于能够引发更深一步思考的问题，我会在回复的内容中写上“好问题”三个字，方便你搜索，你也可以去看看他们的留言。</p>
<p>非常感谢大家很细致地看文章，并且留下了那么多和很高质量的留言。知道文章有给大家带来一些新理解，对我来说是一个很好的鼓励。同时，也让其他认真看评论区的同学，有机会发现一些自己还没有意识到的、但可能还不清晰的知识点，这也在总体上提高了整个专栏的质量。再次谢谢你们。</p>
<p>好了，现在就回到我们今天的正文内容。</p>
<p>在前面的基础篇文章中，我给你介绍过索引的基本概念，相信你已经了解了唯一索引和普通索引的区别。今天我们就继续来谈谈，在不同的业务场景下，应该选择普通索引，还是唯一索引？</p>
<p>假设你在维护一个市民系统，每个人都有一个唯一的身份证号，而且业务代码已经保证了不会写入两个重复的身份证号。如果市民系统需要按照身份证号查姓名，就会执行类似这样的 SQL 语句：</p>
<pre><code>select name from CUser where id_card = 'xxxxxxxyyyyyyzzzzz';
</code></pre>
<p>所以，你一定会考虑在 id_card 字段上建索引。</p>
<p>由于身份证号字段比较大，我不建议你把身份证号当做主键，那么现在你有两个选择，要么给 id_card 字段创建唯一索引，要么创建一个普通索引。如果业务代码已经保证了不会写入重复的身份证号，那么这两个选择逻辑上都是正确的。</p>
<p>现在我要问你的是，从性能的角度考虑，你选择唯一索引还是普通索引呢？选择的依据是什么呢？</p>
<p>简单起见，我们还是用第 4 篇文章[深入浅出索引（上）]中的例子来说明，假设字段 k 上的值都不重复。</p>
<p><img src="assets/1ed9536031d6698570ea175a7b7f9a46.png" alt="img" /></p>
<p>图 1 InnoDB 的索引组织结构</p>
<p>接下来，我们就从这两种索引对查询语句和更新语句的性能影响来进行分析。</p>
<h1>查询过程</h1>
<p>假设，执行查询的语句是 select id from T where k=5。这个查询语句在索引树上查找的过程，先是通过 B+ 树从树根开始，按层搜索到叶子节点，也就是图中右下角的这个数据页，然后可以认为数据页内部通过二分法来定位记录。</p>
<ul>
<li>对于普通索引来说，查找到满足条件的第一个记录 (5,500) 后，需要查找下一个记录，直到碰到第一个不满足 k=5 条件的记录。</li>
<li>对于唯一索引来说，由于索引定义了唯一性，查找到第一个满足条件的记录后，就会停止继续检索。</li>
</ul>
<p>那么，这个不同带来的性能差距会有多少呢？答案是，微乎其微。</p>
<p>你知道的，InnoDB 的数据是按数据页为单位来读写的。也就是说，当需要读一条记录的时候，并不是将这个记录本身从磁盘读出来，而是以页为单位，将其整体读入内存。在 InnoDB 中，每个数据页的大小默认是 16KB。</p>
<p>因为引擎是按页读写的，所以说，当找到 k=5 的记录的时候，它所在的数据页就都在内存里了。那么，对于普通索引来说，要多做的那一次“查找和判断下一条记录”的操作，就只需要一次指针寻找和一次计算。</p>
<p>当然，如果 k=5 这个记录刚好是这个数据页的最后一个记录，那么要取下一个记录，必须读取下一个数据页，这个操作会稍微复杂一些。</p>
<p>但是，我们之前计算过，对于整型字段，一个数据页可以放近千个 key，因此出现这种情况的概率会很低。所以，我们计算平均性能差异时，仍可以认为这个操作成本对于现在的 CPU 来说可以忽略不计。</p>
<h1>更新过程</h1>
<p>为了说明普通索引和唯一索引对更新语句性能的影响这个问题，我需要先跟你介绍一下 change buffer。</p>
<p>当需要更新一个数据页时，如果数据页在内存中就直接更新，而如果这个数据页还没有在内存中的话，在不影响数据一致性的前提下，InooDB 会将这些更新操作缓存在 change buffer 中，这样就不需要从磁盘中读入这个数据页了。在下次查询需要访问这个数据页的时候，将数据页读入内存，然后执行 change buffer 中与这个页有关的操作。通过这种方式就能保证这个数据逻辑的正确性。</p>
<p>需要说明的是，虽然名字叫作 change buffer，实际上它是可以持久化的数据。也就是说，change buffer 在内存中有拷贝，也会被写入到磁盘上。</p>
<p>将 change buffer 中的操作应用到原数据页，得到最新结果的过程称为 merge。除了访问这个数据页会触发 merge 外，系统有后台线程会定期 merge。在数据库正常关闭（shutdown）的过程中，也会执行 merge 操作。</p>
<p>显然，如果能够将更新操作先记录在 change buffer，减少读磁盘，语句的执行速度会得到明显的提升。而且，数据读入内存是需要占用 buffer pool 的，所以这种方式还能够避免占用内存，提高内存利用率。</p>
<p>那么，<strong>什么条件下可以使用 change buffer 呢？</strong></p>
<p>对于唯一索引来说，所有的更新操作都要先判断这个操作是否违反唯一性约束。比如，要插入 (4,400) 这个记录，就要先判断现在表中是否已经存在 k=4 的记录，而这必须要将数据页读入内存才能判断。如果都已经读入到内存了，那直接更新内存会更快，就没必要使用 change buffer 了。</p>
<p>因此，唯一索引的更新就不能使用 change buffer，实际上也只有普通索引可以使用。</p>
<p>change buffer 用的是 buffer pool 里的内存，因此不能无限增大。change buffer 的大小，可以通过参数 innodb_change_buffer_max_size 来动态设置。这个参数设置为 50 的时候，表示 change buffer 的大小最多只能占用 buffer pool 的 50%。</p>
<p>现在，你已经理解了 change buffer 的机制，那么我们再一起来看看<strong>如果要在这张表中插入一个新记录 (4,400) 的话，InnoDB 的处理流程是怎样的。</strong></p>
<p>第一种情况是，<strong>这个记录要更新的目标页在内存中</strong>。这时，InnoDB 的处理流程如下：</p>
<ul>
<li>对于唯一索引来说，找到 3 和 5 之间的位置，判断到没有冲突，插入这个值，语句执行结束；</li>
<li>对于普通索引来说，找到 3 和 5 之间的位置，插入这个值，语句执行结束。</li>
</ul>
<p>这样看来，普通索引和唯一索引对更新语句性能影响的差别，只是一个判断，只会耗费微小的 CPU 时间。</p>
<p>但，这不是我们关注的重点。</p>
<p>第二种情况是，<strong>这个记录要更新的目标页不在内存中</strong>。这时，InnoDB 的处理流程如下：</p>
<ul>
<li>对于唯一索引来说，需要将数据页读入内存，判断到没有冲突，插入这个值，语句执行结束；</li>
<li>对于普通索引来说，则是将更新记录在 change buffer，语句执行就结束了。</li>
</ul>
<p>将数据从磁盘读入内存涉及随机 IO 的访问，是数据库里面成本最高的操作之一。change buffer 因为减少了随机磁盘访问，所以对更新性能的提升是会很明显的。</p>
<p>之前我就碰到过一件事儿，有个 DBA 的同学跟我反馈说，他负责的某个业务的库内存命中率突然从 99% 降低到了 75%，整个系统处于阻塞状态，更新语句全部堵住。而探究其原因后，我发现这个业务有大量插入数据的操作，而他在前一天把其中的某个普通索引改成了唯一索引。</p>
<h1>change buffer 的使用场景</h1>
<p>通过上面的分析，你已经清楚了使用 change buffer 对更新过程的加速作用，也清楚了 change buffer 只限于用在普通索引的场景下，而不适用于唯一索引。那么，现在有一个问题就是：普通索引的所有场景，使用 change buffer 都可以起到加速作用吗？</p>
<p>因为 merge 的时候是真正进行数据更新的时刻，而 change buffer 的主要目的就是将记录的变更动作缓存下来，所以在一个数据页做 merge 之前，change buffer 记录的变更越多（也就是这个页面上要更新的次数越多），收益就越大。</p>
<p>因此，对于写多读少的业务来说，页面在写完以后马上被访问到的概率比较小，此时 change buffer 的使用效果最好。这种业务模型常见的就是账单类、日志类的系统。</p>
<p>反过来，假设一个业务的更新模式是写入之后马上会做查询，那么即使满足了条件，将更新先记录在 change buffer，但之后由于马上要访问这个数据页，会立即触发 merge 过程。这样随机访问 IO 的次数不会减少，反而增加了 change buffer 的维护代价。所以，对于这种业务模式来说，change buffer 反而起到了副作用。</p>
<h1>索引选择和实践</h1>
<p>回到我们文章开头的问题，普通索引和唯一索引应该怎么选择。其实，这两类索引在查询能力上是没差别的，主要考虑的是对更新性能的影响。所以，我建议你尽量选择普通索引。</p>
<p>如果所有的更新后面，都马上伴随着对这个记录的查询，那么你应该关闭 change buffer。而在其他情况下，change buffer 都能提升更新性能。</p>
<p>在实际使用中，你会发现，普通索引和 change buffer 的配合使用，对于数据量大的表的更新优化还是很明显的。</p>
<p>特别地，在使用机械硬盘时，change buffer 这个机制的收效是非常显著的。所以，当你有一个类似“历史数据”的库，并且出于成本考虑用的是机械硬盘时，那你应该特别关注这些表里的索引，尽量使用普通索引，然后把 change buffer 尽量开大，以确保这个“历史数据”表的数据写入速度。</p>
<h1>change buffer 和 redo log</h1>
<p>理解了 change buffer 的原理，你可能会联想到我在前面文章中和你介绍过的 redo log 和 WAL。</p>
<p>在前面文章的评论中，我发现有同学混淆了 redo log 和 change buffer。WAL 提升性能的核心机制，也的确是尽量减少随机读写，这两个概念确实容易混淆。所以，这里我把它们放到了同一个流程里来说明，便于你区分这两个概念。</p>
<blockquote>
<p>备注：这里，你可以再回顾下第 2 篇文章[日志系统：一条 SQL 更新语句是如何执行的？]中的相关内容。</p>
</blockquote>
<p>现在，我们要在表上执行这个插入语句：</p>
<pre><code>mysql&gt; insert into t(id,k) values(id1,k1),(id2,k2);
</code></pre>
<p>这里，我们假设当前 k 索引树的状态，查找到位置后，k1 所在的数据页在内存 (InnoDB buffer pool) 中，k2 所在的数据页不在内存中。如图 2 所示是带 change buffer 的更新状态图。</p>
<p><img src="assets/980a2b786f0ea7adabef2e64fb4c4ca3.png" alt="img" /></p>
<p>图 2 带 change buffer 的更新过程</p>
<p>分析这条更新语句，你会发现它涉及了四个部分：内存、redo log（ib_log_fileX）、 数据表空间（t.ibd）、系统表空间（ibdata1）。</p>
<p>这条更新语句做了如下的操作（按照图中的数字顺序）：</p>
<ol>
<li>Page 1 在内存中，直接更新内存；</li>
<li>Page 2 没有在内存中，就在内存的 change buffer 区域，记录下“我要往 Page 2 插入一行”这个信息</li>
<li>将上述两个动作记入 redo log 中（图中 3 和 4）。</li>
</ol>
<p>做完上面这些，事务就可以完成了。所以，你会看到，执行这条更新语句的成本很低，就是写了两处内存，然后写了一处磁盘（两次操作合在一起写了一次磁盘），而且还是顺序写的。</p>
<p>同时，图中的两个虚线箭头，是后台操作，不影响更新的响应时间。</p>
<p>那在这之后的读请求，要怎么处理呢？</p>
<p>比如，我们现在要执行 select * from t where k in (k1, k2)。这里，我画了这两个读请求的流程图。</p>
<p>如果读语句发生在更新语句后不久，内存中的数据都还在，那么此时的这两个读操作就与系统表空间（ibdata1）和 redo log（ib_log_fileX）无关了。所以，我在图中就没画出这两部分。</p>
<p><img src="assets/6dc743577af1dbcbb8550bddbfc5f98e.png" alt="img" /></p>
<p>图 3 带 change buffer 的读过程</p>
<p>从图中可以看到：</p>
<ol>
<li>读 Page 1 的时候，直接从内存返回。有几位同学在前面文章的评论中问到，WAL 之后如果读数据，是不是一定要读盘，是不是一定要从 redo log 里面把数据更新以后才可以返回？其实是不用的。你可以看一下图 3 的这个状态，虽然磁盘上还是之前的数据，但是这里直接从内存返回结果，结果是正确的。</li>
<li>要读 Page 2 的时候，需要把 Page 2 从磁盘读入内存中，然后应用 change buffer 里面的操作日志，生成一个正确的版本并返回结果。</li>
</ol>
<p>可以看到，直到需要读 Page 2 的时候，这个数据页才会被读入内存。</p>
<p>所以，如果要简单地对比这两个机制在提升更新性能上的收益的话，<strong>redo log 主要节省的是随机写磁盘的 IO 消耗（转成顺序写），而 change buffer 主要节省的则是随机读磁盘的 IO 消耗。</strong></p>
<h1>小结</h1>
<p>今天，我从普通索引和唯一索引的选择开始，和你分享了数据的查询和更新过程，然后说明了 change buffer 的机制以及应用场景，最后讲到了索引选择的实践。</p>
<p>由于唯一索引用不上 change buffer 的优化机制，因此如果业务可以接受，从性能角度出发我建议你优先考虑非唯一索引。</p>
<p>最后，又到了思考题时间。</p>
<p>通过图 2 你可以看到，change buffer 一开始是写内存的，那么如果这个时候机器掉电重启，会不会导致 change buffer 丢失呢？change buffer 丢失可不是小事儿，再从磁盘读入数据可就没有了 merge 过程，就等于是数据丢失了。会不会出现这种情况呢？</p>
<p>你可以把你的思考和观点写在留言区里，我会在下一篇文章的末尾和你讨论这个问题。感谢你的收听，也欢迎你把这篇文章分享给更多的朋友一起阅读。</p>
<p><strong>补充：</strong>
评论区大家对“是否使用唯一索引”有比较多的讨论，主要是纠结在“业务可能无法确保”的情况。这里，我再说明一下：</p>
<ul>
<li>首先，业务正确性优先。咱们这篇文章的前提是“业务代码已经保证不会写入重复数据”的情况下，讨论性能问题。如果业务不能保证，或者业务就是要求数据库来做约束，那么没得选，必须创建唯一索引。这种情况下，本篇文章的意义在于，如果碰上了大量插入数据慢、内存命中率低的时候，可以给你多提供一个排查思路。</li>
<li>然后，在一些“归档库”的场景，你是可以考虑使用普通索引的。比如，线上数据只需要保留半年，然后历史数据保存在归档库。这时候，归档数据已经是确保没有唯一键冲突了。要提高归档效率，可以考虑把表里面的唯一索引改成普通索引。</li>
</ul>
<h1>上期问题时间</h1>
<p>上期的问题是：如何构造一个“数据无法修改”的场景。评论区里已经有不少同学给出了正确答案，这里我再描述一下。</p>
<p><img src="assets/be7a4d8af04cdf93aaa11108933559ae.png" alt="img" />
这样，session A 看到的就是我截图的效果了。</p>
<p>其实，还有另外一种场景，同学们在留言区都还没有提到。</p>
<p><img src="assets/e24a0689571337959138d787c408defa.png" alt="img" /></p>
<p>这个操作序列跑出来，session A 看的内容也是能够复现我截图的效果的。这个 session B’启动的事务比 A 要早，其实是上期我们描述事务版本的可见性规则时留的彩蛋，因为规则里还有一个“活跃事务的判断”，我是准备留到这里再补充的。</p>
<p>当我试图在这里讲述完整规则的时候，发现第 8 篇文章[事务到底是隔离的还是不隔离的？]中的解释引入了太多的概念，以致于分析起来非常复杂。</p>
<p>因此，我重写了第 8 篇，这样我们人工去判断可见性的时候，才会更方便。【看到这里，我建议你能够再重新打开第 8 篇文章并认真学习一次。如果学习的过程中，有任何问题，也欢迎你给我留言】</p>
<p>用新的方式来分析 session B’的更新为什么对 session A 不可见就是：在 session A 视图数组创建的瞬间，session B’是活跃的，属于“版本未提交，不可见”这种情况。</p>
</div>
                    </div>
                    <div>
                        <div style="float: left">
                            <a href="/专栏/MySQL实战45讲/08  事务到底是隔离的还是不隔离的？.md.html">上一页</a>
                        </div>
                        <div style="float: right">
                            <a href="/专栏/MySQL实战45讲/10  MySQL为什么有时候会选错索引？.md.html">下一页</a>
                        </div>
                    </div>
                </div>
            </div>
        </div>
    </div>
    <a class="off-canvas-overlay" onclick="hide_canvas()"></a>
</div>
<script defer src="https://static.cloudflareinsights.com/beacon.min.js/v652eace1692a40cfa3763df669d7439c1639079717194" integrity="sha512-Gi7xpJR8tSkrpF7aordPZQlW2DLtzUlZcumS8dMQjwDHEnw9I7ZLyiOj/6tZStRBGtGgN6ceN6cMH8z7etPGlw==" data-cf-beacon='{"rayId":"7099729e6a0f3d60","version":"2021.12.0","r":1,"token":"1f5d475227ce4f0089a7cff1ab17c0f5","si":100}' crossorigin="anonymous"></script>
</body>
<!-- Global site tag (gtag.js) - Google Analytics -->
<script async src="https://www.googletagmanager.com/gtag/js?id=G-NPSEEVD756"></script>
<script>
    window.dataLayer = window.dataLayer || [];
    function gtag() {
        dataLayer.push(arguments);
    }
    gtag('js', new Date());
    gtag('config', 'G-NPSEEVD756');
    var path = window.location.pathname
    var cookie = getCookie("lastPath");
    console.log(path)
    if (path.replace("/", "") === "") {
        if (cookie.replace("/", "") !== "") {
            console.log(cookie)
            document.getElementById("tip").innerHTML = "<a href='" + cookie + "'>跳转到上次进度</a>"
        }
    } else {
        setCookie("lastPath", path)
    }
    function setCookie(cname, cvalue) {
        var d = new Date();
        d.setTime(d.getTime() + (180 * 24 * 60 * 60 * 1000));
        var expires = "expires=" + d.toGMTString();
        document.cookie = cname + "=" + cvalue + "; " + expires + ";path = /";
    }
    function getCookie(cname) {
        var name = cname + "=";
        var ca = document.cookie.split(';');
        for (var i = 0; i < ca.length; i++) {
            var c = ca[i].trim();
            if (c.indexOf(name) === 0) return c.substring(name.length, c.length);
        }
        return "";
    }
</script>
</html>