fix img & index.html & .md.html

2025-11-21 08:26:48 +08:00 · 2022-08-14 03:40:33 +08:00
parent 85b6063789
commit 08120ee33c
3375 changed files with 151526 additions and 1217663 deletions
--- a/理解ftrace（2）：怎么理解ftrace背后的技术tracepoint和kprobe？.md.html
+++ b/理解ftrace（2）：怎么理解ftrace背后的技术tracepoint和kprobe？.md.html
@@ -1,916 +1,504 @@
 <!DOCTYPE html>
-
 <!-- saved from url=(0046)https://kaiiiz.github.io/hexo-theme-book-demo/ -->
-
 <html xmlns="http://www.w3.org/1999/xhtml">
-
 <head>
-
    <head>
-
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
-
        <meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1.0, user-scalable=no">
-
        <link rel="icon" href="/static/favicon.png">
-
        <title>加餐04 理解ftrace（2）：怎么理解ftrace背后的技术tracepoint和kprobe？.md.html</title>
-
        <!-- Spectre.css framework -->
-
        <link rel="stylesheet" href="/static/index.css">
-
        <!-- theme css & js -->
-
        <meta name="generator" content="Hexo 4.2.0">
-
    </head>
 <body>
 <div class="book-container">
-
    <div class="book-sidebar">
-
        <div class="book-brand">
-
            <a href="/">
-
                <img src="/static/favicon.png">
-
                <span>技术文章摘抄</span>
-
            </a>
-
        </div>
-
        <div class="book-menu uncollapsible">
-
            <ul class="uncollapsible">
-
                <li><a href="/" class="current-tab">首页</a></li>
-
            </ul>
            <ul class="uncollapsible">
-
                <li><a href="../">上一级</a></li>
-
            </ul>
            <ul class="uncollapsible">
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/00 开篇词 一个态度两个步骤，成为容器实战高手.md.html">00 开篇词 一个态度两个步骤，成为容器实战高手.md.html</a>
+                    <a href="/专栏/容器实战高手课/00 开篇词 一个态度两个步骤，成为容器实战高手.md.html">00 开篇词 一个态度两个步骤，成为容器实战高手</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/01 认识容器：容器的基本操作和实现原理.md.html">01 认识容器：容器的基本操作和实现原理.md.html</a>
+                    <a href="/专栏/容器实战高手课/01 认识容器：容器的基本操作和实现原理.md.html">01 认识容器：容器的基本操作和实现原理</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/02 理解进程（1）：为什么我在容器中不能kill 1号进程？.md.html">02 理解进程（1）：为什么我在容器中不能kill 1号进程？.md.html</a>
+                    <a href="/专栏/容器实战高手课/02 理解进程（1）：为什么我在容器中不能kill 1号进程？.md.html">02 理解进程（1）：为什么我在容器中不能kill 1号进程？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/03 理解进程（2）：为什么我的容器里有这么多僵尸进程？.md.html">03 理解进程（2）：为什么我的容器里有这么多僵尸进程？.md.html</a>
+                    <a href="/专栏/容器实战高手课/03 理解进程（2）：为什么我的容器里有这么多僵尸进程？.md.html">03 理解进程（2）：为什么我的容器里有这么多僵尸进程？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/04 理解进程（3）：为什么我在容器中的进程被强制杀死了？.md.html">04 理解进程（3）：为什么我在容器中的进程被强制杀死了？.md.html</a>
+                    <a href="/专栏/容器实战高手课/04 理解进程（3）：为什么我在容器中的进程被强制杀死了？.md.html">04 理解进程（3）：为什么我在容器中的进程被强制杀死了？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/05 容器CPU（1）：怎么限制容器的CPU使用？.md.html">05 容器CPU（1）：怎么限制容器的CPU使用？.md.html</a>
+                    <a href="/专栏/容器实战高手课/05 容器CPU（1）：怎么限制容器的CPU使用？.md.html">05 容器CPU（1）：怎么限制容器的CPU使用？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/06 容器CPU（2）：如何正确地拿到容器CPU的开销？.md.html">06 容器CPU（2）：如何正确地拿到容器CPU的开销？.md.html</a>
+                    <a href="/专栏/容器实战高手课/06 容器CPU（2）：如何正确地拿到容器CPU的开销？.md.html">06 容器CPU（2）：如何正确地拿到容器CPU的开销？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/07 Load Average：加了CPU Cgroup限制，为什么我的容器还是很慢？.md.html">07 Load Average：加了CPU Cgroup限制，为什么我的容器还是很慢？.md.html</a>
+                    <a href="/专栏/容器实战高手课/07 Load Average：加了CPU Cgroup限制，为什么我的容器还是很慢？.md.html">07 Load Average：加了CPU Cgroup限制，为什么我的容器还是很慢？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/08 容器内存：我的容器为什么被杀了？.md.html">08 容器内存：我的容器为什么被杀了？.md.html</a>
+                    <a href="/专栏/容器实战高手课/08 容器内存：我的容器为什么被杀了？.md.html">08 容器内存：我的容器为什么被杀了？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/09 Page Cache：为什么我的容器内存使用量总是在临界点.md.html">09 Page Cache：为什么我的容器内存使用量总是在临界点.md.html</a>
+                    <a href="/专栏/容器实战高手课/09 Page Cache：为什么我的容器内存使用量总是在临界点.md.html">09 Page Cache：为什么我的容器内存使用量总是在临界点</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/10 Swap：容器可以使用Swap空间吗？.md.html">10 Swap：容器可以使用Swap空间吗？.md.html</a>
+                    <a href="/专栏/容器实战高手课/10 Swap：容器可以使用Swap空间吗？.md.html">10 Swap：容器可以使用Swap空间吗？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/11 容器文件系统：我在容器中读写文件怎么变慢了.md.html">11 容器文件系统：我在容器中读写文件怎么变慢了.md.html</a>
+                    <a href="/专栏/容器实战高手课/11 容器文件系统：我在容器中读写文件怎么变慢了.md.html">11 容器文件系统：我在容器中读写文件怎么变慢了</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/12 容器文件Quota：容器为什么把宿主机的磁盘写满了？.md.html">12 容器文件Quota：容器为什么把宿主机的磁盘写满了？.md.html</a>
+                    <a href="/专栏/容器实战高手课/12 容器文件Quota：容器为什么把宿主机的磁盘写满了？.md.html">12 容器文件Quota：容器为什么把宿主机的磁盘写满了？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/13 容器磁盘限速：我的容器里磁盘读写为什么不稳定.md.html">13 容器磁盘限速：我的容器里磁盘读写为什么不稳定.md.html</a>
+                    <a href="/专栏/容器实战高手课/13 容器磁盘限速：我的容器里磁盘读写为什么不稳定.md.html">13 容器磁盘限速：我的容器里磁盘读写为什么不稳定</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/14 容器中的内存与IO：容器写文件的延时为什么波动很大？.md.html">14 容器中的内存与IO：容器写文件的延时为什么波动很大？.md.html</a>
+                    <a href="/专栏/容器实战高手课/14 容器中的内存与IO：容器写文件的延时为什么波动很大？.md.html">14 容器中的内存与IO：容器写文件的延时为什么波动很大？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/15 容器网络：我修改了procsysnet下的参数，为什么在容器中不起效？.md.html">15 容器网络：我修改了procsysnet下的参数，为什么在容器中不起效？.md.html</a>
+                    <a href="/专栏/容器实战高手课/15 容器网络：我修改了procsysnet下的参数，为什么在容器中不起效？.md.html">15 容器网络：我修改了procsysnet下的参数，为什么在容器中不起效？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/16 容器网络配置（1）：容器网络不通了要怎么调试.md.html">16 容器网络配置（1）：容器网络不通了要怎么调试.md.html</a>
+                    <a href="/专栏/容器实战高手课/16 容器网络配置（1）：容器网络不通了要怎么调试.md.html">16 容器网络配置（1）：容器网络不通了要怎么调试</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/17 容器网络配置（2）：容器网络延时要比宿主机上的高吗.md.html">17 容器网络配置（2）：容器网络延时要比宿主机上的高吗.md.html</a>
+                    <a href="/专栏/容器实战高手课/17 容器网络配置（2）：容器网络延时要比宿主机上的高吗.md.html">17 容器网络配置（2）：容器网络延时要比宿主机上的高吗</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/18 容器网络配置（3）：容器中的网络乱序包怎么这么高？.md.html">18 容器网络配置（3）：容器中的网络乱序包怎么这么高？.md.html</a>
+                    <a href="/专栏/容器实战高手课/18 容器网络配置（3）：容器中的网络乱序包怎么这么高？.md.html">18 容器网络配置（3）：容器中的网络乱序包怎么这么高？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/19 容器安全（1）：我的容器真的需要privileged权限吗.md.html">19 容器安全（1）：我的容器真的需要privileged权限吗.md.html</a>
+                    <a href="/专栏/容器实战高手课/19 容器安全（1）：我的容器真的需要privileged权限吗.md.html">19 容器安全（1）：我的容器真的需要privileged权限吗</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/20 容器安全（2）：在容器中，我不以root用户来运行程序可以吗？.md.html">20 容器安全（2）：在容器中，我不以root用户来运行程序可以吗？.md.html</a>
+                    <a href="/专栏/容器实战高手课/20 容器安全（2）：在容器中，我不以root用户来运行程序可以吗？.md.html">20 容器安全（2）：在容器中，我不以root用户来运行程序可以吗？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/加餐01 案例分析：怎么解决海量IPVS规则带来的网络延时抖动问题？.md.html">加餐01 案例分析：怎么解决海量IPVS规则带来的网络延时抖动问题？.md.html</a>
+                    <a href="/专栏/容器实战高手课/加餐01 案例分析：怎么解决海量IPVS规则带来的网络延时抖动问题？.md.html">加餐01 案例分析：怎么解决海量IPVS规则带来的网络延时抖动问题？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/加餐02 理解perf：怎么用perf聚焦热点函数？.md.html">加餐02 理解perf：怎么用perf聚焦热点函数？.md.html</a>
+                    <a href="/专栏/容器实战高手课/加餐02 理解perf：怎么用perf聚焦热点函数？.md.html">加餐02 理解perf：怎么用perf聚焦热点函数？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/加餐03 理解ftrace（1）：怎么应用ftrace查看长延时内核函数？.md.html">加餐03 理解ftrace（1）：怎么应用ftrace查看长延时内核函数？.md.html</a>
+                    <a href="/专栏/容器实战高手课/加餐03 理解ftrace（1）：怎么应用ftrace查看长延时内核函数？.md.html">加餐03 理解ftrace（1）：怎么应用ftrace查看长延时内核函数？</a>
                </li>
-
                <li>
-                    <a class="current-tab" href="/专栏/容器实战高手课/加餐04 理解ftrace（2）：怎么理解ftrace背后的技术tracepoint和kprobe？.md.html">加餐04 理解ftrace（2）：怎么理解ftrace背后的技术tracepoint和kprobe？.md.html</a>
+                    <a class="current-tab" href="/专栏/容器实战高手课/加餐04 理解ftrace（2）：怎么理解ftrace背后的技术tracepoint和kprobe？.md.html">加餐04 理解ftrace（2）：怎么理解ftrace背后的技术tracepoint和kprobe？</a>

-                    
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/加餐05 eBPF：怎么更加深入地查看内核中的函数？.md.html">加餐05 eBPF：怎么更加深入地查看内核中的函数？.md.html</a>
+                    <a href="/专栏/容器实战高手课/加餐05 eBPF：怎么更加深入地查看内核中的函数？.md.html">加餐05 eBPF：怎么更加深入地查看内核中的函数？</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/加餐06 BCC：入门eBPF的前端工具.md.html">加餐06 BCC：入门eBPF的前端工具.md.html</a>
+                    <a href="/专栏/容器实战高手课/加餐06 BCC：入门eBPF的前端工具.md.html">加餐06 BCC：入门eBPF的前端工具</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/加餐福利 课后思考题答案合集.md.html">加餐福利 课后思考题答案合集.md.html</a>
+                    <a href="/专栏/容器实战高手课/加餐福利 课后思考题答案合集.md.html">加餐福利 课后思考题答案合集</a>
                </li>
-
                <li>
                    
-
-                    <a href="/专栏/容器实战高手课/结束语 跳出舒适区，突破思考的惰性.md.html">结束语 跳出舒适区，突破思考的惰性.md.html</a>
+                    <a href="/专栏/容器实战高手课/结束语 跳出舒适区，突破思考的惰性.md.html">结束语 跳出舒适区，突破思考的惰性</a>
                </li>
-
            </ul>
        </div>
-
    </div>
    <div class="sidebar-toggle" onclick="sidebar_toggle()" onmouseover="add_inner()" onmouseleave="remove_inner()">
-
        <div class="sidebar-toggle-inner"></div>
-
    </div>
    <script>
-
        function add_inner() {
-
            let inner = document.querySelector('.sidebar-toggle-inner')
-
            inner.classList.add('show')
-
        }
        function remove_inner() {
-
            let inner = document.querySelector('.sidebar-toggle-inner')
-
            inner.classList.remove('show')
-
        }
        function sidebar_toggle() {
-
            let sidebar_toggle = document.querySelector('.sidebar-toggle')
-
            let sidebar = document.querySelector('.book-sidebar')
-
            let content = document.querySelector('.off-canvas-content')
-
            if (sidebar_toggle.classList.contains('extend')) { // show
-
                sidebar_toggle.classList.remove('extend')
-
                sidebar.classList.remove('hide')
-
                content.classList.remove('extend')
-
            } else { // hide
-
                sidebar_toggle.classList.add('extend')
-
                sidebar.classList.add('hide')
-
                content.classList.add('extend')
-
            }
-
        }
-
-
 function open_sidebar() {
-
    let sidebar = document.querySelector('.book-sidebar')
-
    let overlay = document.querySelector('.off-canvas-overlay')
-
    sidebar.classList.add('show')
-
    overlay.classList.add('show')
-
 }
-
 function hide_canvas() {
-
    let sidebar = document.querySelector('.book-sidebar')
-
    let overlay = document.querySelector('.off-canvas-overlay')
-
    sidebar.classList.remove('show')
-
    overlay.classList.remove('show')
-
 }
    </script>
    <div class="off-canvas-content">
-
        <div class="columns">
-
            <div class="column col-12 col-lg-12">
-
                <div class="book-navbar">
-
                    <!-- For Responsive Layout -->
-
                    <header class="navbar">
-
                        <section class="navbar-section">
-
                            <a onclick="open_sidebar()">
-
                                <i class="icon icon-menu"></i>
-
                            </a>
-
                        </section>
-
                    </header>
-
                </div>
-
                <div class="book-content" style="max-width: 960px; margin: 0 auto;
-
    overflow-x: auto;
-
    overflow-y: hidden;">
-
                    <div class="book-post">
-
                        <p id="tip" align="center"></p>
-
                        <div><h1>加餐04 理解ftrace（2）：怎么理解ftrace背后的技术tracepoint和kprobe？</h1>
-
 <p>你好，我是程远。</p>
-
 <p>前面两讲，我们分别学习了 perf 和 ftrace 这两个最重要 Linux tracing 工具。在学习过程中，我们把重点放在了这两个工具最基本的功能点上。</p>
-
 <p>不过你学习完这些之后，我们内核调试版图的知识点还没有全部点亮。</p>
-
 <p>如果你再去查看一些 perf、ftrace 或者其他 Linux tracing 相关资料，你可能会常常看到两个单词，“tracepoint”和“kprobe”。你有没有好奇过，这两个名词到底是什么意思，它们和 perf、ftrace 这些工具又是什么关系呢？</p>
-
 <p>这一讲，我们就来学习这两个在 Linux tracing 系统中非常重要的概念，它们就是 tracepoint 和 kprobe。</p>
-
 <h2>tracepoint 和 kprobe 的应用举例</h2>
-
 <p>如果你深入地去看一些 perf 或者 ftrace 的功能，这时候你会发现它们都有跟 tracepoint、kprobe 相关的命令。我们先来看几个例子，通过这几个例子，你可以大概先了解一下 tracepoint 和 kprobe 的应用，这样我们后面做详细的原理介绍时，你也会更容易理解。</p>
-
 <p>首先看看 tracepoint，tracepoint 其实就是在 Linux 内核的一些关键函数中埋下的 hook 点，这样在 tracing 的时候，我们就可以在这些固定的点上挂载调试的函数，然后查看内核的信息。</p>
-
 <p>我们通过下面的这个 perf list 命令，就可以看到所有的 tracepoints：</p>
-
 <pre><code># perf list | grep Tracepoint
-
  alarmtimer:alarmtimer_cancel                       [Tracepoint event]
-
  alarmtimer:alarmtimer_fired                        [Tracepoint event]
-
  alarmtimer:alarmtimer_start                        [Tracepoint event]
-
  alarmtimer:alarmtimer_suspend                      [Tracepoint event]
-
  block:block_bio_backmerge                          [Tracepoint event]
-
  block:block_bio_bounce                             [Tracepoint event]
-
  block:block_bio_complete                           [Tracepoint event]
-
  block:block_bio_frontmerge                         [Tracepoint event]
-
  block:block_bio_queue                              [Tracepoint event]
-
 …
-
 </code></pre>
-
 <p>至于 ftrace，你在 tracefs 文件系统中，也会看到一样的 tracepoints：</p>
-
 <pre><code># find /sys/kernel/debug/tracing/events -type d | sort
-
 /sys/kernel/debug/tracing/events
-
 /sys/kernel/debug/tracing/events/alarmtimer
-
 /sys/kernel/debug/tracing/events/alarmtimer/alarmtimer_cancel
-
 /sys/kernel/debug/tracing/events/alarmtimer/alarmtimer_fired
-
 /sys/kernel/debug/tracing/events/alarmtimer/alarmtimer_start
-
 /sys/kernel/debug/tracing/events/alarmtimer/alarmtimer_suspend
-
 /sys/kernel/debug/tracing/events/block
-
 /sys/kernel/debug/tracing/events/block/block_bio_backmerge
-
 /sys/kernel/debug/tracing/events/block/block_bio_bounce
-
 /sys/kernel/debug/tracing/events/block/block_bio_complete
-
 /sys/kernel/debug/tracing/events/block/block_bio_frontmerge
-
 …
-
 </code></pre>
-
 <p>为了让你更好理解，我们就拿“do_sys_open”这个 tracepoint 做例子。在内核函数 do_sys_open() 中，有一个 trace_do_sys_open() 调用，其实它这就是一个 tracepoint：</p>
-
 <pre><code>long do_sys_open(int dfd, const char __user *filename, int flags, umode_t mode)
-
 {
-
        struct open_flags op;
-
        int fd = build_open_flags(flags, mode, &amp;op);
-
        struct filename *tmp;
        if (fd)
-
                return fd;
        tmp = getname(filename);
-
        if (IS_ERR(tmp))
-
                return PTR_ERR(tmp);
        fd = get_unused_fd_flags(flags);
-
        if (fd &gt;= 0) {
-
                struct file *f = do_filp_open(dfd, tmp, &amp;op);
-
                if (IS_ERR(f)) {
-
                        put_unused_fd(fd);
-
                        fd = PTR_ERR(f);
-
                } else {
-
                        fsnotify_open(f);
-
                        fd_install(fd, f);
-
                        trace_do_sys_open(tmp-&gt;name, flags, mode);
-
                }
-
        }
-
        putname(tmp);
-
        return fd;
-
 }
-
 </code></pre>
-
 <p>接下来，我们可以通过 perf 命令，利用 tracepoint 来查看一些内核函数发生的频率，比如在节点上，统计 10 秒钟内调用 do_sys_open 成功的次数，也就是打开文件的次数。</p>
-
 <pre><code># # perf stat -a -e fs:do_sys_open -- sleep 10
 Performance counter stats for 'system wide':
                 7      fs:do_sys_open
      10.001954100 seconds time elapsed
-
 </code></pre>
-
 <p>同时，如果我们把 tracefs 中 do_sys_open 的 tracepoint 打开，那么在 ftrace 的 trace 输出里，就可以看到具体 do_sys_open 每次调用成功时，打开的文件名、文件属性、对应的进程等信息。</p>
-
 <pre><code># pwd
-
 /sys/kernel/debug/tracing
-
 # echo 1 &gt; events/fs/do_sys_open/enable
 # cat trace
-
 # tracer: nop
-
 #
-
 #                              _-----=&gt; irqs-off
-
 #                             / _----=&gt; need-resched
-
 #                            | / _---=&gt; hardirq/softirq
-
 #                            || / _--=&gt; preempt-depth
-
 #                            ||| /     delay
-
 #           TASK-PID   CPU#  ||||    TIMESTAMP  FUNCTION
-
 #              | |       |   ||||       |         |
-
         systemd-1     [011] .... 17133447.451839: do_sys_open: &quot;/proc/22597/cgroup&quot; 88000 666
-
            bash-4118  [009] .... 17133450.076026: do_sys_open: &quot;/&quot; 98800 0
-
     salt-minion-7101  [010] .... 17133450.478659: do_sys_open: &quot;/etc/hosts&quot; 88000 666
-
 systemd-journal-2199  [011] .... 17133450.487930: do_sys_open: &quot;/proc/6989/cgroup&quot; 88000 666
-
 systemd-journal-2199  [011] .... 17133450.488019: do_sys_open: &quot;/var/log/journal/d4f76e4bf5414ac78e1c534ebe5d0a72&quot; 98800 0
-
 systemd-journal-2199  [011] .... 17133450.488080: do_sys_open: &quot;/proc/6989/comm&quot; 88000 666
-
 systemd-journal-2199  [011] .... 17133450.488114: do_sys_open: &quot;/proc/6989/cmdline&quot; 88000 666
-
 systemd-journal-2199  [011] .... 17133450.488143: do_sys_open: &quot;/proc/6989/status&quot; 88000 666
-
 systemd-journal-2199  [011] .... 17133450.488185: do_sys_open: &quot;/proc/6989/sessionid&quot; 88000 666
-
 …
-
 </code></pre>
-
 <p>请注意，Tracepoint 是在内核中固定的 hook 点，并不是在所有的函数中都有 tracepoint。</p>
-
 <p>比如在上面的例子里，我们看到 do_sys_open() 调用到了 do_filp_open()，但是 do_filp_open() 函数里是没有 tracepoint 的。那如果想看到 do_filp_open() 函数被调用的频率，或者 do_filp_open() 在被调用时传入参数的情况，我们又该怎么办呢？</p>
-
 <p>这时候，我们就需要用到 kprobe 了。kprobe 可以动态地在所有的内核函数（除了 inline 函数）上挂载 probe 函数。我们还是结合例子做理解，先看看 perf 和 ftraces 是怎么利用 kprobe 来做调试的。</p>
-
 <p>比如对于 do_filp_open() 函数，我们可以通过perf probe添加一下，然后用perf stat 看看在 10 秒钟的时间里，这个函数被调用到的次数。</p>
-
 <pre><code># perf probe --add do_filp_open
-
 # perf stat -a -e probe:do_filp_open -- sleep 10
-
 Performance counter stats for 'system wide':
                11      probe:do_filp_open
      10.001489223 seconds time elapsed
-
 </code></pre>
-
 <p>我们也可以通过 ftrace 的 tracefs 给 do_filp_open() 添加一个 kprobe event，这样就能查看 do_filp_open() 每次被调用的时候，前面两个参数的值了。</p>
-
 <p>这里我要给你说明一下，在写入 kprobe_event 的时候，对于参数的定义我们用到了“%di”和“%si”。这是 x86 处理器里的寄存器，根据 x86 的Application Binary Interface 的文档，在函数被调用的时候，%di 存放了第一个参数，%si 存放的是第二个参数。</p>
-
 <pre><code># echo 'p:kprobes/myprobe do_filp_open dfd=+0(%di):u32 pathname=+0(+0(%si)):string' &gt; /sys/kernel/debug/tracing/kprobe_event
-
 </code></pre>
-
 <p>完成上面的写入之后，我们再 enable 这个新建的 kprobe event。这样在 trace 中，我们就可以看到每次 do_filp_open（）被调用时前两个参数的值了。</p>
-
 <pre><code># echo 1 &gt; /sys/kernel/debug/tracing/events/kprobes/myprobe/enable
 # cat /sys/kernel/debug/tracing/trace
-
 …
-
      irqbalance-1328  [005] .... 2773211.189573: myprobe: (do_filp_open+0x0/0x100) dfd=4294967295 pathname=&quot;/proc/interrupts&quot;
-
      irqbalance-1328  [005] .... 2773211.189740: myprobe: (do_filp_open+0x0/0x100) dfd=638399 pathname=&quot;/proc/stat&quot;
-
      irqbalance-1328  [005] .... 2773211.189800: myprobe: (do_filp_open+0x0/0x100) dfd=638399 pathname=&quot;/proc/irq/8/smp_affinity&quot;
-
            bash-15864 [004] .... 2773211.219048: myprobe: (do_filp_open+0x0/0x100) dfd=14819 pathname=&quot;/sys/kernel/debug/tracing/&quot;
-
            bash-15864 [004] .... 2773211.891472: myprobe: (do_filp_open+0x0/0x100) dfd=6859 pathname=&quot;/sys/kernel/debug/tracing/&quot;
-
            bash-15864 [004] .... 2773212.036449: myprobe: (do_filp_open+0x0/0x100) dfd=4294967295 pathname=&quot;/sys/kernel/debug/tracing/&quot;
-
            bash-15864 [004] .... 2773212.197525: myprobe: (do_filp_open+0x0/0x100) dfd=638259 pathname=&quot;/sys/kernel/debug/tracing/
-
 …
-
 </code></pre>
-
 <p>好了，我们通过 perf 和 ftrace 的几个例子，简单了解了 tracepoint 和 kprobe 是怎么用的。那下面我们再来看看它们的实现原理。</p>
-
 <h2>Tracepoint</h2>
-
 <p>刚才，我们已经看到了内核函数 do_sys_open() 里调用了 trace_do_sys_open() 这个 treacepoint，那这个 tracepoint 是怎么实现的呢？我们还要再仔细研究一下。</p>
-
 <p>如果你在内核代码中，直接搜索“trace_do_sys_open”字符串的话，并不能找到这个函数的直接定义。这是因为在 Linux 中，每一个 tracepoint 的相关数据结构和函数，主要是通过&quot;DEFINE_TRACE&quot;和&quot;DECLARE_TRACE&quot;这两个宏来定义的。</p>
-
 <p>完整的“DEFINE_TRACE”和“DECLARE_TRACE”宏里，给每个 tracepoint 都定义了一组函数。在这里，我会选择最主要的几个函数，把定义一个 tracepoint 的过程给你解释一下。</p>
-
 <p>首先，我们来看“trace_##name”这个函数（提示一下，这里的“##”是 C 语言的预编译宏，表示把两个字符串连接起来）。</p>
-
 <p>对于每个命名为“name”的 tracepoint，这个宏都会帮助它定一个函数。这个函数的格式是这样的，以“trace_”开头，再加上 tracepoint 的名字。</p>
-
 <p>我们举个例子吧。比如说，对于“do_sys_open”这个 tracepoint，它生成的函数名就是 trace_do_sys_open。而这个函数会被内核函数 do_sys_open() 调用，从而实现了一个内核的 tracepoint。</p>
-
 <pre><code>static inline void trace_##name(proto)                          \
-
        {                                                               \
-
                if (static_key_false(&amp;__tracepoint_##name.key))         \
-
                        __DO_TRACE(&amp;__tracepoint_##name,                \
-
                                TP_PROTO(data_proto),                   \
-
                                TP_ARGS(data_args),                     \
-
                                TP_CONDITION(cond), 0);                 \
-
                if (IS_ENABLED(CONFIG_LOCKDEP) &amp;&amp; (cond)) {             \
-
                        rcu_read_lock_sched_notrace();                  \
-
                        rcu_dereference_sched(__tracepoint_##name.funcs);\
-
                        rcu_read_unlock_sched_notrace();                \
-
                }                                                       \
-
        }
-
 </code></pre>
-
 <p>在这个 tracepoint 函数里，主要的功能是这样实现的，通过 __DO_TRACE 来调用所有注册在这个 tracepoint 上的 probe 函数。</p>
-
 <pre><code>#define __DO_TRACE(tp, proto, args, cond, rcuidle)                      \
-
 …
                it_func_ptr = rcu_dereference_raw((tp)-&gt;funcs);         \
-
                                                                        \
-
                if (it_func_ptr) {                                      \
-
                        do {                                            \
-
                                it_func = (it_func_ptr)-&gt;func;          \
-
                                __data = (it_func_ptr)-&gt;data;           \
-
                                ((void(*)(proto))(it_func))(args);      \
-
                        } while ((++it_func_ptr)-&gt;func);                \
-
                }
-
 …
 …
-
 </code></pre>
-
 <p>而 probe 函数的注册，它可以通过宏定义的“register_trace_##name”函数完成。</p>
-
 <pre><code>        static inline int                                               \
-
        register_trace_##name(void (*probe)(data_proto), void *data)    \
-
        {                                                               \
-
                return tracepoint_probe_register(&amp;__tracepoint_##name,  \
-
                                                (void *)probe, data);   \
-
        }
-
 </code></pre>
-
 <p>我们可以自己写一个简单kernel module来注册一个 probe 函数，把它注册到已有的 treacepoint 上。这样，这个 probe 函数在每次 tracepoint 点被调用到的时候就会被执行。你可以动手试一下。</p>
-
 <p>好了，说到这里，tracepoint 的实现方式我们就讲完了。简单来说就是在内核代码中需要被 trace 的地方显式地加上 hook 点，然后再把自己的 probe 函数注册上去，那么在代码执行的时候，就可以执行 probe 函数。</p>
-
 <h2>Kprobe</h2>
-
 <p>我们已经知道了，tracepoint 为内核 trace 提供了 hook 点，但是这些 hook 点需要在内核源代码中预先写好。如果在 debug 的过程中，我们需要查看的内核函数中没有 hook 点，就需要像前面 perf/ftrace 的例子中那样，要通过 Linux kprobe 机制来加载 probe 函数。</p>
-
 <p>那我们要怎么来理解 kprobe 的实现机制呢？</p>
-
 <p>你可以先从内核 samples 代码里，看一下</p>
-
 <p>kprobe_example.c代码。这段代码里实现了一个 kernel module，可以在内核中任意一个函数名 / 符号对应的代码地址上注册三个 probe 函数，分别是“pre_handler”、  “post_handler”和“fault_handler”。</p>
-
 <pre><code>#define MAX_SYMBOL_LEN   64
-
 static char symbol[MAX_SYMBOL_LEN] = &quot;_do_fork&quot;;
-
 module_param_string(symbol, symbol, sizeof(symbol), 0644);
 /* For each probe you need to allocate a kprobe structure */
-
 static struct kprobe kp = {
-
            .symbol_name = symbol,
-
 };
 …
 static int __init kprobe_init(void)
-
 {
-
            int ret;
-
            kp.pre_handler = handler_pre;
-
            kp.post_handler = handler_post;
-
            kp.fault_handler = handler_fault;

- 
-
            ret = register_kprobe(&amp;kp);
-
            if (ret &lt; 0) {
-
                        pr_err(&quot;register_kprobe failed, returned %d\n&quot;, ret);
-
                        return ret;
-
            }
-
            pr_info(&quot;Planted kprobe at %p\n&quot;, kp.addr);
-
            return 0;
-
 }
-
 </code></pre>
-
 <p>当这个内核函数被执行的时候，已经注册的 probe 函数也会被执行 （handler_fault 只有在发生异常的时候才会被调用到）。</p>
-
 <p>比如，我们加载的这个 kernel module 不带参数，那么缺省的情况就是这样的：在“_do_fork”内核函数的入口点注册了这三个 probe 函数。</p>
-
 <p>当 _do_fork() 函数被调用到的时候，换句话说，也就是创建新的进程时，我们通过 dmesg 就可以看到 probe 函数的输出了。</p>
-
 <pre><code>[8446287.087641] &lt;_do_fork&gt; pre_handler: p-&gt;addr = 0x00000000d301008e, ip = ffffffffb1e8c9d1, flags = 0x246
-
 [8446287.087643] &lt;_do_fork&gt; post_handler: p-&gt;addr = 0x00000000d301008e, flags = 0x246
-
 [8446288.019731] &lt;_do_fork&gt; pre_handler: p-&gt;addr = 0x00000000d301008e, ip = ffffffffb1e8c9d1, flags = 0x246
-
 [8446288.019733] &lt;_do_fork&gt; post_handler: p-&gt;addr = 0x00000000d301008e, flags = 0x246
-
 [8446288.022091] &lt;_do_fork&gt; pre_handler: p-&gt;addr = 0x00000000d301008e, ip = ffffffffb1e8c9d1, flags = 0x246
-
 [8446288.022093] &lt;_do_fork&gt; post_handler: p-&gt;addr = 0x00000000d301008e, flags = 0x246
-
 </code></pre>
-
 <p>kprobe 的基本工作原理其实也很简单。当 kprobe 函数注册的时候，其实就是把目标地址上内核代码的指令码，替换成了“cc”，也就是 int3 指令。这样一来，当内核代码执行到这条指令的时候，就会触发一个异常而进入到 Linux int3 异常处理函数 do_int3() 里。</p>
-
 <p>在 do_int3() 这个函数里，如果发现有对应的 kprobe 注册了 probe，就会依次执行注册的 pre_handler()，原来的指令，最后是 post_handler()。</p>
-
 <p><img src="assets/5495fee9d95a7f0df6b7f48d8bd25196.jpeg" alt="img" /></p>
-
 <p>理论上 kprobe 其实只要知道内核代码中任意一条指令的地址，就可以为这个地址注册 probe 函数，kprobe 结构中的“addr”成员就可以接受内核中的指令地址。</p>
-
 <pre><code>static int __init kprobe_init(void)
-
 {
-
        int ret;
-
        kp.addr = (kprobe_opcode_t *)0xffffffffb1e8ca02; /* 把一条指令的地址赋值给 kprobe.addr */
-
        kp.pre_handler = handler_pre;
-
        kp.post_handler = handler_post;
-
        kp.fault_handler = handler_fault;
        ret = register_kprobe(&amp;kp);
-
        if (ret &lt; 0) {
-
                pr_err(&quot;register_kprobe failed, returned %d\n&quot;, ret);
-
                return ret;
-
        }
-
        pr_info(&quot;Planted kprobe at %p\n&quot;, kp.addr);
-
        return 0;
-
 }
-
 </code></pre>
-
 <p>还要说明的是，如果内核可以使用我们上一讲 ftrace 对函数的 trace 方式，也就是函数头上预留了“callq &lt;<strong>fentry</strong>&gt;”的 5 个字节（在启动的时候被替换成了 nop）。Kprobe 对于函数头指令的 trace 方式，也会用“ftrace_caller”指令替换的方式，而不再使用 int3 指令替换。</p>
-
 <p>不论是哪种替换方式，kprobe 的基本实现原理都是一样的，那就是把目标指令替换，替换的指令可以使程序跑到一个特定的 handler 里，去执行 probe 的函数。</p>
-
 <h2>重点小结</h2>
-
 <p>这一讲我们主要学习了 tracepoint 和 kprobe，这两个概念在 Linux tracing 系统中非常重要。</p>
-
 <p>为什么说它们重要呢？因为从 Linux tracing 系统看，我的理解是可以大致分成大致这样三层。</p>
-
 <p>第一层是最基础的提供数据的机制，这里就包含了 tracepoints、kprobes，还有一些别的 events，比如 perf 使用的 HW/SW events。</p>
-
 <p>第二层是进行数据收集的工具，这里包含了 ftrace、perf，还有 ebpf。</p>
-
 <p>第三层是用户层工具。虽然有了第二层，用户也可以得到数据。不过，对于大多数用户来说，第二层使用的友好程度还不够，所以又有了这一层。</p>
-
 <p><img src="assets/9048753d623f0aec9e8b513623f1ec8b.jpeg" alt="img" /></p>
-
 <p>很显然，如果要对 Linux 内核调试，很难绕过 tracepoint 和 kprobe。如果不刨根问底的话，前面我们讲的 perf、trace 工具对你来说还是黑盒。因为你只是知道了这些工具怎么用，但是并不知道它们依赖的底层技术。</p>
-
 <p>在后面介绍 ebpf 的时候，我们还会继续学习 ebpf 是如何使用 tracepoint 和 kprobe 来做 Linux tracing 的，希望你可以把相关知识串联起来。</p>
-
 <h2>思考题</h2>
-
 <p>想想看，当我们用 kprobe 为一个内核函数注册了 probe 之后，怎样能看到对应内核函数的第一条指令被替换了呢？</p>
-
 <p>欢迎你在留言区记录你的思考或者疑问。如果这一讲对你有帮助，也欢迎你转发给同事、朋友，跟他们一起交流、进步。</p>
-
 </div>
-
                    </div>
-
                    <div>
-
                        <div style="float: left">
-
                            <a href="/专栏/容器实战高手课/加餐03 理解ftrace（1）：怎么应用ftrace查看长延时内核函数？.md.html">上一页</a>
-
                        </div>
-
                        <div style="float: right">
-
                            <a href="/专栏/容器实战高手课/加餐05 eBPF：怎么更加深入地查看内核中的函数？.md.html">下一页</a>
-
                        </div>
-
                    </div>
                </div>
-
            </div>
-
        </div>
-
    </div>
    <a class="off-canvas-overlay" onclick="hide_canvas()"></a>
-
 </div>
-
 <script defer src="https://static.cloudflareinsights.com/beacon.min.js/v652eace1692a40cfa3763df669d7439c1639079717194" integrity="sha512-Gi7xpJR8tSkrpF7aordPZQlW2DLtzUlZcumS8dMQjwDHEnw9I7ZLyiOj/6tZStRBGtGgN6ceN6cMH8z7etPGlw==" data-cf-beacon='{"rayId":"709977b67bda3cfa","version":"2021.12.0","r":1,"token":"1f5d475227ce4f0089a7cff1ab17c0f5","si":100}' crossorigin="anonymous"></script>
-
 </body>
-
 <!-- Global site tag (gtag.js) - Google Analytics -->
-
 <script async src="https://www.googletagmanager.com/gtag/js?id=G-NPSEEVD756"></script>
-
 <script>
-
    window.dataLayer = window.dataLayer || [];
    function gtag() {
-
        dataLayer.push(arguments);
-
    }
    gtag('js', new Date());
-
    gtag('config', 'G-NPSEEVD756');
-
    var path = window.location.pathname
-
    var cookie = getCookie("lastPath");
-
    console.log(path)
-
    if (path.replace("/", "") === "") {
-
        if (cookie.replace("/", "") !== "") {
-
            console.log(cookie)
-
            document.getElementById("tip").innerHTML = "<a href='" + cookie + "'>跳转到上次进度</a>"
-
        }
-
    } else {
-
        setCookie("lastPath", path)
-
    }
    function setCookie(cname, cvalue) {
-
        var d = new Date();
-
        d.setTime(d.getTime() + (180 * 24 * 60 * 60 * 1000));
-
        var expires = "expires=" + d.toGMTString();
-
        document.cookie = cname + "=" + cvalue + "; " + expires + ";path = /";
-
    }
    function getCookie(cname) {
-
        var name = cname + "=";
-
        var ca = document.cookie.split(';');
-
        for (var i = 0; i < ca.length; i++) {
-
            var c = ca[i].trim();
-
            if (c.indexOf(name) === 0) return c.substring(name.length, c.length);
-
        }
-
        return "";
-
    }
 </script>
 </html>
-