learn.lianglianglee.com/文章/JVM CPU Profiler技术原理及源码深度解析.md.html
2022-05-11 19:04:14 +08:00

977 lines
62 KiB
HTML
Raw Blame History

This file contains invisible Unicode characters

This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

<!DOCTYPE html>
<!-- saved from url=(0046)https://kaiiiz.github.io/hexo-theme-book-demo/ -->
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1.0, user-scalable=no">
<link rel="icon" href="/static/favicon.png">
<title>JVM CPU Profiler技术原理及源码深度解析.md.html</title>
<!-- Spectre.css framework -->
<link rel="stylesheet" href="/static/index.css">
<!-- theme css & js -->
<meta name="generator" content="Hexo 4.2.0">
</head>
<body>
<div class="book-container">
<div class="book-sidebar">
<div class="book-brand">
<a href="/">
<img src="/static/favicon.png">
<span>技术文章摘抄</span>
</a>
</div>
<div class="book-menu uncollapsible">
<ul class="uncollapsible">
<li><a href="/" class="current-tab">首页</a></li>
</ul>
<ul class="uncollapsible">
<li><a href="../">上一级</a></li>
</ul>
<ul class="uncollapsible">
<li>
<a href="/文章/AQS 万字图文全面解析.md.html">AQS 万字图文全面解析.md.html</a>
</li>
<li>
<a href="/文章/Docker 镜像构建原理及源码分析.md.html">Docker 镜像构建原理及源码分析.md.html</a>
</li>
<li>
<a href="/文章/ElasticSearch 小白从入门到精通.md.html">ElasticSearch 小白从入门到精通.md.html</a>
</li>
<li>
<a class="current-tab" href="/文章/JVM CPU Profiler技术原理及源码深度解析.md.html">JVM CPU Profiler技术原理及源码深度解析.md.html</a>
</li>
<li>
<a href="/文章/JVM 垃圾收集器.md.html">JVM 垃圾收集器.md.html</a>
</li>
<li>
<a href="/文章/JVM 面试的 30 个知识点.md.html">JVM 面试的 30 个知识点.md.html</a>
</li>
<li>
<a href="/文章/Java IO 体系、线程模型大总结.md.html">Java IO 体系、线程模型大总结.md.html</a>
</li>
<li>
<a href="/文章/Java NIO浅析.md.html">Java NIO浅析.md.html</a>
</li>
<li>
<a href="/文章/Java 面试题集锦(网络篇).md.html">Java 面试题集锦(网络篇).md.html</a>
</li>
<li>
<a href="/文章/Java-直接内存 DirectMemory 详解.md.html">Java-直接内存 DirectMemory 详解.md.html</a>
</li>
<li>
<a href="/文章/Java中9种常见的CMS GC问题分析与解决.md.html">Java中9种常见的CMS GC问题分析与解决.md.html</a>
</li>
<li>
<a href="/文章/Java中9种常见的CMS GC问题分析与解决.md.html">Java中9种常见的CMS GC问题分析与解决.md.html</a>
</li>
<li>
<a href="/文章/Java中的SPI.md.html">Java中的SPI.md.html</a>
</li>
<li>
<a href="/文章/Java中的ThreadLocal.md.html">Java中的ThreadLocal.md.html</a>
</li>
<li>
<a href="/文章/Java线程池实现原理及其在美团业务中的实践.md.html">Java线程池实现原理及其在美团业务中的实践.md.html</a>
</li>
<li>
<a href="/文章/Java魔法类Unsafe应用解析.md.html">Java魔法类Unsafe应用解析.md.html</a>
</li>
<li>
<a href="/文章/Kafka 源码阅读笔记.md.html">Kafka 源码阅读笔记.md.html</a>
</li>
<li>
<a href="/文章/Kafka、ActiveMQ、RabbitMQ、RocketMQ 区别以及高可用原理.md.html">Kafka、ActiveMQ、RabbitMQ、RocketMQ 区别以及高可用原理.md.html</a>
</li>
<li>
<a href="/文章/MySQL · 引擎特性 · InnoDB Buffer Pool.md.html">MySQL · 引擎特性 · InnoDB Buffer Pool.md.html</a>
</li>
<li>
<a href="/文章/MySQL · 引擎特性 · InnoDB IO子系统.md.html">MySQL · 引擎特性 · InnoDB IO子系统.md.html</a>
</li>
<li>
<a href="/文章/MySQL · 引擎特性 · InnoDB 事务系统.md.html">MySQL · 引擎特性 · InnoDB 事务系统.md.html</a>
</li>
<li>
<a href="/文章/MySQL · 引擎特性 · InnoDB 同步机制.md.html">MySQL · 引擎特性 · InnoDB 同步机制.md.html</a>
</li>
<li>
<a href="/文章/MySQL · 引擎特性 · InnoDB 数据页解析.md.html">MySQL · 引擎特性 · InnoDB 数据页解析.md.html</a>
</li>
<li>
<a href="/文章/MySQL · 引擎特性 · InnoDB崩溃恢复.md.html">MySQL · 引擎特性 · InnoDB崩溃恢复.md.html</a>
</li>
<li>
<a href="/文章/MySQL · 引擎特性 · 临时表那些事儿.md.html">MySQL · 引擎特性 · 临时表那些事儿.md.html</a>
</li>
<li>
<a href="/文章/MySQL 主从复制 半同步复制.md.html">MySQL 主从复制 半同步复制.md.html</a>
</li>
<li>
<a href="/文章/MySQL 主从复制 基于GTID复制.md.html">MySQL 主从复制 基于GTID复制.md.html</a>
</li>
<li>
<a href="/文章/MySQL 主从复制.md.html">MySQL 主从复制.md.html</a>
</li>
<li>
<a href="/文章/MySQL 事务日志(redo log和undo log).md.html">MySQL 事务日志(redo log和undo log).md.html</a>
</li>
<li>
<a href="/文章/MySQL 亿级别数据迁移实战代码分享.md.html">MySQL 亿级别数据迁移实战代码分享.md.html</a>
</li>
<li>
<a href="/文章/MySQL 从一条数据说起-InnoDB行存储数据结构.md.html">MySQL 从一条数据说起-InnoDB行存储数据结构.md.html</a>
</li>
<li>
<a href="/文章/MySQL 地基基础:事务和锁的面纱.md.html">MySQL 地基基础:事务和锁的面纱.md.html</a>
</li>
<li>
<a href="/文章/MySQL 地基基础:数据字典.md.html">MySQL 地基基础:数据字典.md.html</a>
</li>
<li>
<a href="/文章/MySQL 地基基础:数据库字符集.md.html">MySQL 地基基础:数据库字符集.md.html</a>
</li>
<li>
<a href="/文章/MySQL 性能优化:碎片整理.md.html">MySQL 性能优化:碎片整理.md.html</a>
</li>
<li>
<a href="/文章/MySQL 故障诊断:一个 ALTER TALBE 执行了很久,你慌不慌?.md.html">MySQL 故障诊断:一个 ALTER TALBE 执行了很久,你慌不慌?.md.html</a>
</li>
<li>
<a href="/文章/MySQL 故障诊断:如何在日志中轻松定位大事务.md.html">MySQL 故障诊断:如何在日志中轻松定位大事务.md.html</a>
</li>
<li>
<a href="/文章/MySQL 故障诊断:教你快速定位加锁的 SQL.md.html">MySQL 故障诊断:教你快速定位加锁的 SQL.md.html</a>
</li>
<li>
<a href="/文章/MySQL 日志详解.md.html">MySQL 日志详解.md.html</a>
</li>
<li>
<a href="/文章/MySQL 的半同步是什么?.md.html">MySQL 的半同步是什么?.md.html</a>
</li>
<li>
<a href="/文章/MySQL中的事务和MVCC.md.html">MySQL中的事务和MVCC.md.html</a>
</li>
<li>
<a href="/文章/MySQL事务_事务隔离级别详解.md.html">MySQL事务_事务隔离级别详解.md.html</a>
</li>
<li>
<a href="/文章/MySQL优化优化 select count().md.html">MySQL优化优化 select count().md.html</a>
</li>
<li>
<a href="/文章/MySQL共享锁、排他锁、悲观锁、乐观锁.md.html">MySQL共享锁、排他锁、悲观锁、乐观锁.md.html</a>
</li>
<li>
<a href="/文章/MySQL的MVCC多版本并发控制.md.html">MySQL的MVCC多版本并发控制.md.html</a>
</li>
<li>
<a href="/文章/QingStor 对象存储架构设计及最佳实践.md.html">QingStor 对象存储架构设计及最佳实践.md.html</a>
</li>
<li>
<a href="/文章/RocketMQ 面试题集锦.md.html">RocketMQ 面试题集锦.md.html</a>
</li>
<li>
<a href="/文章/SnowFlake 雪花算法生成分布式 ID.md.html">SnowFlake 雪花算法生成分布式 ID.md.html</a>
</li>
<li>
<a href="/文章/Spring Boot 2.x 结合 k8s 实现分布式微服务架构.md.html">Spring Boot 2.x 结合 k8s 实现分布式微服务架构.md.html</a>
</li>
<li>
<a href="/文章/Spring Boot 教程:如何开发一个 starter.md.html">Spring Boot 教程:如何开发一个 starter.md.html</a>
</li>
<li>
<a href="/文章/Spring MVC 原理.md.html">Spring MVC 原理.md.html</a>
</li>
<li>
<a href="/文章/Spring MyBatis和Spring整合的奥秘.md.html">Spring MyBatis和Spring整合的奥秘.md.html</a>
</li>
<li>
<a href="/文章/Spring 帮助你更好的理解Spring循环依赖.md.html">Spring 帮助你更好的理解Spring循环依赖.md.html</a>
</li>
<li>
<a href="/文章/Spring 循环依赖及解决方式.md.html">Spring 循环依赖及解决方式.md.html</a>
</li>
<li>
<a href="/文章/Spring中眼花缭乱的BeanDefinition.md.html">Spring中眼花缭乱的BeanDefinition.md.html</a>
</li>
<li>
<a href="/文章/Vert.x 基础入门.md.html">Vert.x 基础入门.md.html</a>
</li>
<li>
<a href="/文章/eBay 的 Elasticsearch 性能调优实践.md.html">eBay 的 Elasticsearch 性能调优实践.md.html</a>
</li>
<li>
<a href="/文章/不可不说的Java“锁”事.md.html">不可不说的Java“锁”事.md.html</a>
</li>
<li>
<a href="/文章/互联网并发限流实战.md.html">互联网并发限流实战.md.html</a>
</li>
<li>
<a href="/文章/从ReentrantLock的实现看AQS的原理及应用.md.html">从ReentrantLock的实现看AQS的原理及应用.md.html</a>
</li>
<li>
<a href="/文章/从SpringCloud开始聊微服务架构.md.html">从SpringCloud开始聊微服务架构.md.html</a>
</li>
<li>
<a href="/文章/全面了解 JDK 线程池实现原理.md.html">全面了解 JDK 线程池实现原理.md.html</a>
</li>
<li>
<a href="/文章/分布式一致性理论与算法.md.html">分布式一致性理论与算法.md.html</a>
</li>
<li>
<a href="/文章/分布式一致性算法 Raft.md.html">分布式一致性算法 Raft.md.html</a>
</li>
<li>
<a href="/文章/分布式唯一 ID 解析.md.html">分布式唯一 ID 解析.md.html</a>
</li>
<li>
<a href="/文章/分布式链路追踪:集群管理设计.md.html">分布式链路追踪:集群管理设计.md.html</a>
</li>
<li>
<a href="/文章/动态代理种类及原理,你知道多少?.md.html">动态代理种类及原理,你知道多少?.md.html</a>
</li>
<li>
<a href="/文章/响应式架构与 RxJava 在有赞零售的实践.md.html">响应式架构与 RxJava 在有赞零售的实践.md.html</a>
</li>
<li>
<a href="/文章/大数据算法——布隆过滤器.md.html">大数据算法——布隆过滤器.md.html</a>
</li>
<li>
<a href="/文章/如何优雅地记录操作日志?.md.html">如何优雅地记录操作日志?.md.html</a>
</li>
<li>
<a href="/文章/如何设计一个亿级消息量的 IM 系统.md.html">如何设计一个亿级消息量的 IM 系统.md.html</a>
</li>
<li>
<a href="/文章/异步网络模型.md.html">异步网络模型.md.html</a>
</li>
<li>
<a href="/文章/当我们在讨论CQRS时我们在讨论些神马.md.html">当我们在讨论CQRS时我们在讨论些神马.md.html</a>
</li>
<li>
<a href="/文章/彻底理解 MySQL 的索引机制.md.html">彻底理解 MySQL 的索引机制.md.html</a>
</li>
<li>
<a href="/文章/最全的 116 道 Redis 面试题解答.md.html">最全的 116 道 Redis 面试题解答.md.html</a>
</li>
<li>
<a href="/文章/有赞权限系统(SAM).md.html">有赞权限系统(SAM).md.html</a>
</li>
<li>
<a href="/文章/有赞零售中台建设方法的探索与实践.md.html">有赞零售中台建设方法的探索与实践.md.html</a>
</li>
<li>
<a href="/文章/服务注册与发现原理剖析Eureka、Zookeeper、Nacos.md.html">服务注册与发现原理剖析Eureka、Zookeeper、Nacos.md.html</a>
</li>
<li>
<a href="/文章/深入浅出Cache.md.html">深入浅出Cache.md.html</a>
</li>
<li>
<a href="/文章/深入理解 MySQL 底层实现.md.html">深入理解 MySQL 底层实现.md.html</a>
</li>
<li>
<a href="/文章/漫画讲解 git rebase VS git merge.md.html">漫画讲解 git rebase VS git merge.md.html</a>
</li>
<li>
<a href="/文章/生成浏览器唯一稳定 ID 的探索.md.html">生成浏览器唯一稳定 ID 的探索.md.html</a>
</li>
<li>
<a href="/文章/缓存 如何保证缓存与数据库的双写一致性?.md.html">缓存 如何保证缓存与数据库的双写一致性?.md.html</a>
</li>
<li>
<a href="/文章/网易严选怎么做全链路监控的?.md.html">网易严选怎么做全链路监控的?.md.html</a>
</li>
<li>
<a href="/文章/美团万亿级 KV 存储架构与实践.md.html">美团万亿级 KV 存储架构与实践.md.html</a>
</li>
<li>
<a href="/文章/美团点评Kubernetes集群管理实践.md.html">美团点评Kubernetes集群管理实践.md.html</a>
</li>
<li>
<a href="/文章/美团百亿规模API网关服务Shepherd的设计与实现.md.html">美团百亿规模API网关服务Shepherd的设计与实现.md.html</a>
</li>
<li>
<a href="/文章/解读《阿里巴巴 Java 开发手册》背后的思考.md.html">解读《阿里巴巴 Java 开发手册》背后的思考.md.html</a>
</li>
<li>
<a href="/文章/认识 MySQL 和 Redis 的数据一致性问题.md.html">认识 MySQL 和 Redis 的数据一致性问题.md.html</a>
</li>
<li>
<a href="/文章/进阶Dockerfile 高阶使用指南及镜像优化.md.html">进阶Dockerfile 高阶使用指南及镜像优化.md.html</a>
</li>
<li>
<a href="/文章/铁总在用的高性能分布式缓存计算框架 Geode.md.html">铁总在用的高性能分布式缓存计算框架 Geode.md.html</a>
</li>
<li>
<a href="/文章/阿里云PolarDB及其共享存储PolarFS技术实现分析.md.html">阿里云PolarDB及其共享存储PolarFS技术实现分析.md.html</a>
</li>
<li>
<a href="/文章/阿里云PolarDB及其共享存储PolarFS技术实现分析.md.html">阿里云PolarDB及其共享存储PolarFS技术实现分析.md.html</a>
</li>
<li>
<a href="/文章/面试最常被问的 Java 后端题.md.html">面试最常被问的 Java 后端题.md.html</a>
</li>
<li>
<a href="/文章/领域驱动设计在互联网业务开发中的实践.md.html">领域驱动设计在互联网业务开发中的实践.md.html</a>
</li>
<li>
<a href="/文章/领域驱动设计的菱形对称架构.md.html">领域驱动设计的菱形对称架构.md.html</a>
</li>
<li>
<a href="/文章/高效构建 Docker 镜像的最佳实践.md.html">高效构建 Docker 镜像的最佳实践.md.html</a>
</li>
</ul>
</div>
</div>
<div class="sidebar-toggle" onclick="sidebar_toggle()" onmouseover="add_inner()" onmouseleave="remove_inner()">
<div class="sidebar-toggle-inner"></div>
</div>
<script>
function add_inner() {
let inner = document.querySelector('.sidebar-toggle-inner')
inner.classList.add('show')
}
function remove_inner() {
let inner = document.querySelector('.sidebar-toggle-inner')
inner.classList.remove('show')
}
function sidebar_toggle() {
let sidebar_toggle = document.querySelector('.sidebar-toggle')
let sidebar = document.querySelector('.book-sidebar')
let content = document.querySelector('.off-canvas-content')
if (sidebar_toggle.classList.contains('extend')) { // show
sidebar_toggle.classList.remove('extend')
sidebar.classList.remove('hide')
content.classList.remove('extend')
} else { // hide
sidebar_toggle.classList.add('extend')
sidebar.classList.add('hide')
content.classList.add('extend')
}
}
function open_sidebar() {
let sidebar = document.querySelector('.book-sidebar')
let overlay = document.querySelector('.off-canvas-overlay')
sidebar.classList.add('show')
overlay.classList.add('show')
}
function hide_canvas() {
let sidebar = document.querySelector('.book-sidebar')
let overlay = document.querySelector('.off-canvas-overlay')
sidebar.classList.remove('show')
overlay.classList.remove('show')
}
</script>
<div class="off-canvas-content">
<div class="columns">
<div class="column col-12 col-lg-12">
<div class="book-navbar">
<!-- For Responsive Layout -->
<header class="navbar">
<section class="navbar-section">
<a onclick="open_sidebar()">
<i class="icon icon-menu"></i>
</a>
</section>
</header>
</div>
<div class="book-content" style="max-width: 960px; margin: 0 auto;
overflow-x: auto;
overflow-y: hidden;">
<div class="book-post">
<p id="tip" align="center"></p>
<div><h1>JVM CPU Profiler技术原理及源码深度解析</h1>
<p>研发人员在遇到线上报警或需要优化系统性能时常常需要分析程序运行行为和性能瓶颈。Profiling技术是一种在应用运行时收集程序相关信息的动态分析手段常用的JVM Profiler可以从多个方面对程序进行动态分析如CPU、Memory、Thread、Classes、GC等其中CPU Profiling的应用最为广泛。CPU Profiling经常被用于分析代码的执行热点如“哪个方法占用CPU的执行时间最长”、“每个方法占用CPU的比例是多少”等等通过CPU Profiling得到上述相关信息后研发人员就可以轻松针对热点瓶颈进行分析和性能优化进而突破性能瓶颈大幅提升系统的吞吐量。</p>
<p>本文介绍了JVM平台上CPU Profiler的实现原理希望能帮助读者在使用类似工具的同时也能清楚其内部的技术实现。</p>
<h2>CPU Profiler简介</h2>
<p>社区实现的JVM Profiler很多比如已经商用且功能强大的<a href="https://www.ej-technologies.com/products/jprofiler/overview.html">JProfiler</a>,也有免费开源的产品,如<a href="https://github.com/uber-common/jvm-profiler">JVM-Profiler</a>功能各有所长。我们日常使用的Intellij IDEA最新版内部也集成了一个简单好用的Profiler详细的介绍参见<a href="https://blog.jetbrains.com/idea/2018/09/intellij-idea-2018-3-eap-git-submodules-jvm-profiler-macos-and-linux-and-more/">官方Blog</a></p>
<p>在用IDEA打开需要诊断的Java项目后在“Preferences -&gt; Build, Execution, Deployment -&gt; Java Profiler”界面添加一个“CPU Profiler”然后回到项目单击右上角的“Run with Profiler”启动项目并开始CPU Profiling过程。一定时间后推荐5min在Profiler界面点击“Stop Profiling and Show Results”即可看到Profiling的结果包含火焰图和调用树如下图所示</p>
<p><img src="assets/80cac68ffeaf0064ca261d5acf285353439115.png" alt="Intellij IDEA - 性能火焰图" /></p>
<p>Intellij IDEA - 性能火焰图</p>
<p><img src="assets/d212c393113d821841023d66c50cb8b8710861.png" alt="Intellij IDEA - 调用堆栈树" /></p>
<p>Intellij IDEA - 调用堆栈树</p>
<p>火焰图是根据调用栈的样本集生成的可视化性能分析图,《<a href="https://www.ruanyifeng.com/blog/2017/09/flame-graph.html">如何读懂火焰图?</a>》一文对火焰图进行了不错的讲解大家可以参考一下。简而言之看火焰图时我们需要关注“平顶”因为那里就是我们程序的CPU热点。调用树是另一种可视化分析的手段与火焰图一样也是根据同一份样本集而生成按需选择即可。</p>
<p>这里要说明一下因为我们没有在项目中引入任何依赖仅仅是“Run with Profiler”Profiler就能获取我们程序运行时的信息。这个功能其实是通过JVM Agent实现的为了更好地帮助大家系统性的了解它我们在这里先对JVM Agent做个简单的介绍。</p>
<h2>JVM Agent简介</h2>
<p>JVM Agent是一个按一定规则编写的特殊程序库可以在启动阶段通过命令行参数传递给JVM作为一个伴生库与目标JVM运行在同一个进程中。在Agent中可以通过固定的接口获取JVM进程内的相关信息。Agent既可以是用C/C++/Rust编写的JVMTI Agent也可以是用Java编写的Java Agent。</p>
<p>执行Java命令我们可以看到Agent相关的命令行参数</p>
<pre><code>Plain Text
-agentlib:&lt;库名&gt;[=&lt;选项&gt;]
加载本机代理库 &lt;库名&gt;, 例如 -agentlib:jdwp
另请参阅 -agentlib:jdwp=help
-agentpath:&lt;路径名&gt;[=&lt;选项&gt;]
按完整路径名加载本机代理库
-javaagent:&lt;jar 路径&gt;[=&lt;选项&gt;]
加载 Java 编程语言代理, 请参阅 java.lang.instrument
</code></pre>
<h3>JVMTI Agent</h3>
<p>JVMTIJVM Tool Interface是JVM提供的一套标准的C/C++编程接口是实现Debugger、Profiler、Monitor、Thread Analyser等工具的统一基础在主流Java虚拟机中都有实现。</p>
<p>当我们要基于JVMTI实现一个Agent时需要实现如下入口函数</p>
<pre><code>// $JAVA_HOME/include/jvmti.h
JNIEXPORT jint JNICALL Agent_OnLoad(JavaVM *vm, char *options, void *reserved);
</code></pre>
<p>使用C/C++实现该函数并将代码编译为动态连接库Linux上是.so通过-agentpath参数将库的完整路径传递给Java进程JVM就会在启动阶段的合适时机执行该函数。在函数内部我们可以通过JavaVM指针参数拿到JNI和JVMTI的函数指针表这样我们就拥有了与JVM进行各种复杂交互的能力。</p>
<p>更多JVMTI相关的细节可以参考<a href="https://docs.oracle.com/en/java/javase/12/docs/specs/jvmti.html">官方文档</a></p>
<h3>Java Agent</h3>
<p>在很多场景下我们没有必要必须使用C/C++来开发JVMTI Agent因为成本高且不易维护。JVM自身基于JVMTI封装了一套Java的Instrument API接口允许使用Java语言开发Java Agent只是一个jar包大大降低了Agent的开发成本。社区开源的产品如<a href="https://github.com/oldmanpushcart/greys-anatomy">Greys</a><a href="https://github.com/alibaba/arthas">Arthas</a><a href="https://github.com/alibaba/jvm-sandbox">JVM-Sandbox</a><a href="https://github.com/uber-common/jvm-profiler">JVM-Profiler</a>等都是纯Java编写的也是以Java Agent形式来运行。</p>
<p>在Java Agent中我们需要在jar包的MANIFEST.MF中将Premain-Class指定为一个入口类并在该入口类中实现如下方法</p>
<pre><code>public static void premain(String args, Instrumentation ins) {
// implement
}
</code></pre>
<p>这样打包出来的jar就是一个Java Agent可以通过-javaagent参数将jar传递给Java进程伴随启动JVM同样会在启动阶段的合适时机执行该方法。</p>
<p>在该方法内部参数Instrumentation接口提供了Retransform Classes的能力我们利用该接口就可以对宿主进程的Class进行修改实现方法耗时统计、故障注入、Trace等功能。Instrumentation接口提供的能力较为单一仅与Class字节码操作相关但由于我们现在已经处于宿主进程环境内就可以利用JMX直接获取宿主进程的内存、线程、锁等信息。无论是Instrument API还是JMX它们内部仍是统一基于JVMTI来实现。</p>
<p>更多Instrument API相关的细节可以参考<a href="https://docs.oracle.com/en/java/javase/12/docs/api/java.instrument/java/lang/instrument/package-summary.html">官方文档</a></p>
<h2>CPU Profiler原理解析</h2>
<p>在了解完Profiler如何以Agent的形式执行后我们可以开始尝试构造一个简单的CPU Profiler。但在此之前还有必要了解下CPU Profiling技术的两种实现方式及其区别。</p>
<h3>Sampling vs Instrumentation</h3>
<p>使用过JProfiler的同学应该都知道JProfiler的CPU Profiling功能提供了两种方式选项: Sampling和Instrumentation它们也是实现CPU Profiler的两种手段。</p>
<p>Sampling方式顾名思义基于对StackTrace的“采样”进行实现核心原理如下</p>
<ol>
<li>引入Profiler依赖或直接利用Agent技术注入目标JVM进程并启动Profiler。</li>
<li>启动一个采样定时器以固定的采样频率每隔一段时间毫秒级对所有线程的调用栈进行Dump。</li>
<li>汇总并统计每次调用栈的Dump结果在一定时间内采到足够的样本后导出统计结果内容是每个方法被采样到的次数及方法的调用关系。</li>
</ol>
<p>Instrumentation则是利用Instrument API对所有必要的Class进行字节码增强在进入每个方法前进行埋点方法执行结束后统计本次方法执行耗时最终进行汇总。二者都能得到想要的结果那么它们有什么区别呢或者说孰优孰劣</p>
<p>Instrumentation方式对几乎所有方法添加了额外的AOP逻辑这会导致对线上服务造成巨额的性能影响但其优势是绝对精准的方法调用次数、调用时间统计。</p>
<p>Sampling方式基于无侵入的额外线程对所有线程的调用栈快照进行固定频率抽样相对前者来说它的性能开销很低。但由于它基于“采样”的模式以及JVM固有的只能在安全点Safe Point进行采样的“缺陷”会导致统计结果存在一定的偏差。譬如说某些方法执行时间极短但执行频率很高真实占用了大量的CPU Time但Sampling Profiler的采样周期不能无限调小这会导致性能开销骤增所以会导致大量的样本调用栈中并不存在刚才提到的”高频小方法“进而导致最终结果无法反映真实的CPU热点。更多Sampling相关的问题可以参考《<a href="https://psy-lob-saw.blogspot.com/2016/02/why-most-sampling-java-profilers-are.html">Why (Most) Sampling Java Profilers Are Fucking Terrible</a>》。</p>
<p>具体到“孰优孰劣”的问题层面这两种实现技术并没有非常明显的高下之判只有在分场景讨论下才有意义。Sampling由于低开销的特性更适合用在CPU密集型的应用中以及不可接受大量性能开销的线上服务中。而Instrumentation则更适合用在I/O密集的应用中、对性能开销不敏感以及确实需要精确统计的场景中。社区的Profiler更多的是基于Sampling来实现本文也是基于Sampling来进行讲解。</p>
<h3>基于Java Agent + JMX实现</h3>
<p>一个最简单的Sampling CPU Profiler可以用Java Agent + JMX方式来实现。以Java Agent为入口进入目标JVM进程后开启一个ScheduledExecutorService定时利用JMX的threadMXBean.dumpAllThreads()来导出所有线程的StackTrace最终汇总并导出即可。</p>
<p>Uber的<a href="https://github.com/uber-common/jvm-profiler">JVM-Profiler</a>实现原理也是如此,关键部分代码如下:</p>
<pre><code class="language-java">// com/uber/profiling/profilers/StacktraceCollectorProfiler.java
/*
* StacktraceCollectorProfiler等同于文中所述CpuProfiler仅命名偏好不同而已
* jvm-profiler的CpuProfiler指代的是CpuLoad指标的Profiler
*/
// 实现了Profiler接口外部由统一的ScheduledExecutorService对所有Profiler定时执行
@Override
public void profile() {
ThreadInfo[] threadInfos = threadMXBean.dumpAllThreads(false, false);
// ...
for (ThreadInfo threadInfo : threadInfos) {
String threadName = threadInfo.getThreadName();
// ...
StackTraceElement[] stackTraceElements = threadInfo.getStackTrace();
// ...
for (int i = stackTraceElements.length - 1; i &gt;= 0; i--) {
StackTraceElement stackTraceElement = stackTraceElements[i];
// ...
}
// ...
}
}
</code></pre>
<p>Uber提供的定时器默认Interval是100ms对于CPU Profiler来说这略显粗糙。但由于dumpAllThreads()的执行开销不容小觑Interval不宜设置的过小所以该方法的CPU Profiling结果会存在不小的误差。</p>
<p>JVM-Profiler的优点在于支持多种指标的ProfilingStackTrace、CPUBusy、Memory、I/O、Method且支持将Profiling结果通过Kafka上报回中心Server进行分析也即支持集群诊断。</p>
<h3>基于JVMTI + GetStackTrace实现</h3>
<p>使用Java实现Profiler相对较简单但也存在一些问题譬如说Java Agent代码与业务代码共享AppClassLoader被JVM直接加载的agent.jar如果引入了第三方依赖可能会对业务Class造成污染。截止发稿时JVM-Profiler都存在这个问题它引入了Kafka-Client、http-Client、Jackson等组件如果与业务代码中的组件版本发生冲突可能会引发未知错误。<a href="https://github.com/oldmanpushcart/greys-anatomy">Greys</a>/<a href="https://github.com/alibaba/arthas">Arthas</a>/<a href="https://github.com/alibaba/jvm-sandbox">JVM-Sandbox</a>的解决方式是分离入口与核心代码使用定制的ClassLoader加载核心代码避免影响业务代码。</p>
<p>在更底层的C/C++层面我们可以直接对接JVMTI接口使用原生C API对JVM进行操作功能更丰富更强大但开发效率偏低。基于上节同样的原理开发CPU Profiler使用JVMTI需要进行如下这些步骤</p>
<p>1.编写Agent_OnLoad()在入口通过JNI的JavaVM*指针的GetEnv()函数拿到JVMTI的jvmtiEnv指针</p>
<pre><code class="language-c">// agent.c
JNIEXPORT jint JNICALL Agent_OnLoad(JavaVM *vm, char *options, void *reserved) {
jvmtiEnv *jvmti;
(*vm)-&gt;GetEnv((void **)&amp;jvmti, JVMTI_VERSION_1_0);
// ...
return JNI_OK;
}
</code></pre>
<p>2.开启一个线程定时循环定时使用jvmtiEnv指针配合调用如下几个JVMTI函数</p>
<pre><code class="language-java">// 获取所有线程的jthread
jvmtiError GetAllThreads(jvmtiEnv *env, jint *threads_count_ptr, jthread **threads_ptr);
// 根据jthread获取该线程信息name、daemon、priority...
jvmtiError GetThreadInfo(jvmtiEnv *env, jthread thread, jvmtiThreadInfo* info_ptr);
// 根据jthread获取该线程调用栈
jvmtiError GetStackTrace(jvmtiEnv *env,
jthread thread,
jint start_depth,
jint max_frame_count,
jvmtiFrameInfo *frame_buffer,
jint *count_ptr);
</code></pre>
<p>主逻辑大致是首先调用GetAllThreads()获取所有线程的“句柄”jthread然后遍历根据jthread调用GetThreadInfo()获取线程信息按线程名过滤掉不需要的线程后继续遍历根据jthread调用GetStackTrace()获取线程的调用栈。</p>
<p>3.在Buffer中保存每一次的采样结果最终生成必要的统计数据即可。</p>
<p>按如上步骤即可实现基于JVMTI的CPU Profiler。但需要说明的是即便是基于原生JVMTI接口使用GetStackTrace()的方式获取调用栈也存在与JMX相同的问题——只能在安全点Safe Point进行采样。</p>
<h3>SafePoint Bias问题</h3>
<p>基于Sampling的CPU Profiler通过采集程序在不同时间点的调用栈样本来近似地推算出热点方法因此从理论上来讲Sampling CPU Profiler必须遵循以下两个原则</p>
<ol>
<li>样本必须足够多。</li>
<li>程序中所有正在运行的代码点都必须以相同的概率被Profiler采样。</li>
</ol>
<p>如果只能在安全点采样就违背了第二条原则。因为我们只能采集到位于安全点时刻的调用栈快照意味着某些代码可能永远没有机会被采样即使它真实耗费了大量的CPU执行时间这种现象被称为“SafePoint Bias”。</p>
<p>上文我们提到基于JMX与基于JVMTI的Profiler实现都存在SafePoint Bias但一个值得了解的细节是单独来说JVMTI的GetStackTrace()函数并不需要在Caller的安全点执行但当调用GetStackTrace()获取其他线程的调用栈时必须等待直到目标线程进入安全点而且GetStackTrace()仅能通过单独的线程同步定时调用不能在UNIX信号处理器的Handler中被异步调用。综合来说GetStackTrace()存在与JMX一样的SafePoint Bias。更多安全点相关的知识可以参考《Safepoints: Meaning, Side Effects and Overheads》。</p>
<p>那么如何避免SafePoint Bias社区提供了一种Hack思路——AsyncGetCallTrace。</p>
<h3>基于JVMTI + AsyncGetCallTrace实现</h3>
<p>如上节所述假如我们拥有一个函数可以获取当前线程的调用栈且不受安全点干扰另外它还支持在UNIX信号处理器中被异步调用那么我们只需注册一个UNIX信号处理器在Handler中调用该函数获取当前线程的调用栈即可。由于UNIX信号会被发送给进程的随机一线程进行处理因此最终信号会均匀分布在所有线程上也就均匀获取了所有线程的调用栈样本。</p>
<p>OracleJDK/OpenJDK内部提供了这么一个函数——AsyncGetCallTrace它的原型如下</p>
<pre><code>// 栈帧
typedef struct {
jint lineno;
jmethodID method_id;
} AGCT_CallFrame;
// 调用栈
typedef struct {
JNIEnv *env;
jint num_frames;
AGCT_CallFrame *frames;
} AGCT_CallTrace;
// 根据ucontext将调用栈填充进trace指针
void AsyncGetCallTrace(AGCT_CallTrace *trace, jint depth, void *ucontext);
</code></pre>
<p>通过原型可以看到该函数的使用方式非常简洁直接通过ucontext就能获取到完整的Java调用栈。</p>
<p>顾名思义AsyncGetCallTrace是“async”的不受安全点影响这样的话采样就可能发生在任何时间包括Native代码执行期间、GC期间等在这时我们是无法获取Java调用栈的AGCT_CallTrace的num_frames字段正常情况下标识了获取到的调用栈深度但在如前所述的异常情况下它就表示为负数最常见的-2代表此刻正在GC。</p>
<p>由于AsyncGetCallTrace非标准JVMTI函数因此我们无法在jvmti.h中找到该函数声明且由于其目标文件也早已链接进JVM二进制文件中所以无法通过简单的声明来获取该函数的地址这需要通过一些Trick方式来解决。简单说Agent最终是作为动态链接库加载到目标JVM进程的地址空间中因此可以在Agent_OnLoad内通过glibc提供的dlsym()函数拿到当前地址空间即目标JVM进程地址空间名为“AsyncGetCallTrace”的符号地址。这样就拿到了该函数的指针按照上述原型进行类型转换后就可以正常调用了。</p>
<p>通过AsyncGetCallTrace实现CPU Profiler的大致流程</p>
<p>1.编写Agent_OnLoad()在入口拿到jvmtiEnv和AsyncGetCallTrace指针获取AsyncGetCallTrace方式如下:</p>
<pre><code>typedef void (*AsyncGetCallTrace)(AGCT_CallTrace *traces, jint depth, void *ucontext);
// ...
AsyncGetCallTrace agct_ptr = (AsyncGetCallTrace)dlsym(RTLD_DEFAULT, &quot;AsyncGetCallTrace&quot;);
if (agct_ptr == NULL) {
void *libjvm = dlopen(&quot;libjvm.so&quot;, RTLD_NOW);
if (!libjvm) {
// 处理dlerror()...
}
agct_ptr = (AsyncGetCallTrace)dlsym(libjvm, &quot;AsyncGetCallTrace&quot;);
}
</code></pre>
<p>2.在OnLoad阶段我们还需要做一件事即注册OnClassLoad和OnClassPrepare这两个Hook原因是jmethodID是延迟分配的使用AGCT获取Traces依赖预先分配好的数据。我们在OnClassPrepare的CallBack中尝试获取该Class的所有Methods这样就使JVMTI提前分配了所有方法的jmethodID如下所示</p>
<pre><code>void JNICALL OnClassLoad(jvmtiEnv *jvmti, JNIEnv* jni, jthread thread, jclass klass) {}
void JNICALL OnClassPrepare(jvmtiEnv *jvmti, JNIEnv *jni, jthread thread, jclass klass) {
jint method_count;
jmethodID *methods;
jvmti-&gt;GetClassMethods(klass, &amp;method_count, &amp;methods);
delete [] methods;
}
// ...
jvmtiEventCallbacks callbacks = {0};
callbacks.ClassLoad = OnClassLoad;
callbacks.ClassPrepare = OnClassPrepare;
jvmti-&gt;SetEventCallbacks(&amp;callbacks, sizeof(callbacks));
jvmti-&gt;SetEventNotificationMode(JVMTI_ENABLE, JVMTI_EVENT_CLASS_LOAD, NULL);
jvmti-&gt;SetEventNotificationMode(JVMTI_ENABLE, JVMTI_EVENT_CLASS_PREPARE, NULL);
</code></pre>
<p>3.利用SIGPROF信号来进行定时采样</p>
<pre><code>// 这里信号handler传进来的的ucontext即AsyncGetCallTrace需要的ucontext
void signal_handler(int signo, siginfo_t *siginfo, void *ucontext) {
// 使用AsyncCallTrace进行采样注意处理num_frames为负的异常情况
}
// ...
// 注册SIGPROF信号的handler
struct sigaction sa;
sigemptyset(&amp;sa.sa_mask);
sa.sa_sigaction = signal_handler;
sa.sa_flags = SA_RESTART | SA_SIGINFO;
sigaction(SIGPROF, &amp;sa, NULL);
// 定时产生SIGPROF信号
// interval是nanoseconds表示的采样间隔AsyncGetCallTrace相对于同步采样来说可以适当高频一些
long sec = interval / 1000000000;
long usec = (interval % 1000000000) / 1000;
struct itimerval tv = {{sec, usec}, {sec, usec}};
setitimer(ITIMER_PROF, &amp;tv, NULL);
</code></pre>
<p>4.在Buffer中保存每一次的采样结果最终生成必要的统计数据即可。</p>
<p>按如上步骤即可实现基于AsyncGetCallTrace的CPU Profiler这是社区中目前性能开销最低、相对效率最高的CPU Profiler实现方式在Linux环境下结合perf_events还能做到同时采样Java栈与Native栈也就能同时分析Native代码中存在的性能热点。该方式的典型开源实现有<a href="https://github.com/jvm-profiling-tools/async-profiler">Async-Profiler</a><a href="https://github.com/jvm-profiling-tools/honest-profiler">Honest-Profiler</a>Async-Profiler实现质量较高感兴趣的话建议大家阅读参考文章。有趣的是IntelliJ IDEA内置的Java Profiler其实就是Async-Profiler的包装。更多关于AsyncGetCallTrace的内容大家可以参考《<a href="https://psy-lob-saw.blogspot.com/2016/06/the-pros-and-cons-of-agct.html">The Pros and Cons of AsyncGetCallTrace Profilers</a>》。</p>
<h3>生成性能火焰图</h3>
<p>现在我们拥有了采样调用栈的能力,但是调用栈样本集是以二维数组的数据结构形式存在于内存中的,如何将其转换为可视化的火焰图呢?</p>
<p>火焰图通常是一个svg文件部分优秀项目可以根据文本文件自动生成火焰图文件仅对文本文件的格式有一定要求。FlameGraph项目的核心只是一个Perl脚本可以根据我们提供的调用栈文本生成相应的火焰图svg文件。调用栈的文本格式相当简单如下所示</p>
<pre><code>base_func;func1;func2;func3 10
base_func;funca;funcb 15
</code></pre>
<p>将我们采样到的调用栈样本集进行整合后,需输出如上所示的文本格式。每一行代表一“类“调用栈,空格左边是调用栈的方法名排列,以分号分割,左栈底右栈顶,空格右边是该样本出现的次数。</p>
<p>将样本文件交给flamegraph.pl脚本执行就能输出相应的火焰图了</p>
<pre><code>$ flamegraph.pl stacktraces.txt &gt; stacktraces.svg
</code></pre>
<p>效果如下图所示:</p>
<p><img src="assets/ae2b3dda630d2de82eb632a6e8d5bee9336049.png" alt="通过flamegraph.pl生成的火焰图" /></p>
<p>通过flamegraph.pl生成的火焰图</p>
<h2>HotSpot的Dynamic Attach机制解析</h2>
<p>到目前为止我们已经了解了CPU Profiler完整的工作原理然而使用过JProfiler/Arthas的同学可能会有疑问很多情况下可以直接对线上运行中的服务进行Profling并不需要在Java进程的启动参数添加Agent参数这是通过什么手段做到的答案是Dynamic Attach。</p>
<p>JDK在1.6以后提供了Attach API允许向运行中的JVM进程添加Agent这项手段被广泛使用在各种Profiler和字节码增强工具中其官方简介如下</p>
<blockquote>
<p>This is a Sun extension that allows a tool to attach to another process running Java code and launch a JVM TI agent or a java.lang.instrument agent in that process.</p>
</blockquote>
<p>总的来说Dynamic Attach是HotSpot提供的一种特殊能力它允许一个进程向另一个运行中的JVM进程发送一些命令并执行命令并不限于加载Agent还包括Dump内存、Dump线程等等。</p>
<h3>通过sun.tools进行Attach</h3>
<p>Attach虽然是HotSpot提供的能力但JDK在Java层面也对其做了封装。</p>
<p>前文已经提到对于Java Agent来说PreMain方法在Agent作为启动参数运行的时候执行其实我们还可以额外实现一个AgentMain方法并在MANIFEST.MF中将Agent-Class指定为该Class</p>
<pre><code>public static void agentmain(String args, Instrumentation ins) {
// implement
}
</code></pre>
<p>这样打包出来的jar既可以作为-javaagent参数启动也可以被Attach到运行中的目标JVM进程。JDK已经封装了简单的API让我们直接Attach一个Java Agent下面以Arthas中的代码进行演示</p>
<pre><code>// com/taobao/arthas/core/Arthas.java
import com.sun.tools.attach.VirtualMachine;
import com.sun.tools.attach.VirtualMachineDescriptor;
// ...
private void attachAgent(Configure configure) throws Exception {
VirtualMachineDescriptor virtualMachineDescriptor = null;
// 拿到所有JVM进程找出目标进程
for (VirtualMachineDescriptor descriptor : VirtualMachine.list()) {
String pid = descriptor.id();
if (pid.equals(Integer.toString(configure.getJavaPid()))) {
virtualMachineDescriptor = descriptor;
}
}
VirtualMachine virtualMachine = null;
try {
// 针对某个JVM进程调用VirtualMachine.attach()方法拿到VirtualMachine实例
if (null == virtualMachineDescriptor) {
virtualMachine = VirtualMachine.attach(&quot;&quot; + configure.getJavaPid());
} else {
virtualMachine = VirtualMachine.attach(virtualMachineDescriptor);
}
// ...
// 调用VirtualMachine#loadAgent()将arthasAgentPath指定的jar attach到目标JVM进程中
// 第二个参数为attach参数即agentmain的首个String参数args
virtualMachine.loadAgent(arthasAgentPath, configure.getArthasCore() + &quot;;&quot; + configure.toString());
} finally {
if (null != virtualMachine) {
// 调用VirtualMachine#detach()释放
virtualMachine.detach();
}
}
}
</code></pre>
<h3>直接对HotSpot进行Attach</h3>
<p>sun.tools封装的API足够简单易用但只能使用Java编写也只能用在Java Agent上因此有些时候我们必须手工对JVM进程直接进行Attach。对于JVMTI除了Agent_OnLoad()之外我们还需实现一个Agent_OnAttach()函数当将JVMTI Agent Attach到目标进程时从该函数开始执行</p>
<pre><code>// $JAVA_HOME/include/jvmti.h
JNIEXPORT jint JNICALL Agent_OnAttach(JavaVM *vm, char *options, void *reserved);
</code></pre>
<p>下面我们以Async-Profiler中的jattach源码为线索探究一下如何利用Attach机制给运行中的JVM进程发送命令。jattach是Async-Profiler提供的一个Driver使用方式比较直观</p>
<pre><code>Usage:
jattach &lt;pid&gt; &lt;cmd&gt; [args ...]
Args:
&lt;pid&gt; 目标JVM进程的进程ID
&lt;cmd&gt; 要执行的命令
&lt;args&gt; 命令参数
</code></pre>
<p>使用方式如:</p>
<pre><code>$ jattach 1234 load /absolute/path/to/agent/libagent.so true
</code></pre>
<p>执行上述命令libagent.so就被加载到ID为1234的JVM进程中并开始执行Agent_OnAttach函数了。有一点需要注意执行Attach的进程euid及egid与被Attach的目标JVM进程必须相同。接下来开始分析jattach源码。</p>
<p>如下所示的Main函数描述了一次Attach的整体流程</p>
<pre><code>// async-profiler/src/jattach/jattach.c
int main(int argc, char** argv) {
// 解析命令行参数
// 检查euid与egid
// ...
if (!check_socket(nspid) &amp;&amp; !start_attach_mechanism(pid, nspid)) {
perror(&quot;Could not start attach mechanism&quot;);
return 1;
}
int fd = connect_socket(nspid);
if (fd == -1) {
perror(&quot;Could not connect to socket&quot;);
return 1;
}
printf(&quot;Connected to remote JVM\n&quot;);
if (!write_command(fd, argc - 2, argv + 2)) {
perror(&quot;Error writing to socket&quot;);
close(fd);
return 1;
}
printf(&quot;Response code = &quot;);
fflush(stdout);
int result = read_response(fd);
close(fd);
return result;
}
</code></pre>
<p>忽略掉命令行参数解析与检查euid和egid的过程。jattach首先调用了check_socket函数进行了“socket检查check_socket源码如下</p>
<pre><code>// async-profiler/src/jattach/jattach.c
// Check if remote JVM has already opened socket for Dynamic Attach
static int check_socket(int pid) {
char path[MAX_PATH];
snprintf(path, MAX_PATH, &quot;%s/.java_pid%d&quot;, get_temp_directory(), pid); // get_temp_directory()在Linux下固定返回&quot;/tmp&quot;
struct stat stats;
return stat(path, &amp;stats) == 0 &amp;&amp; S_ISSOCK(stats.st_mode);
}
</code></pre>
<p>我们知道UNIX操作系统提供了一种基于文件的Socket接口称为“UNIX Socket”一种常用的进程间通信方式。在该函数中使用S_ISSOCK宏来判断该文件是否被绑定到了UNIX Socket如此看来“/tmp/.java_pid”文件很有可能就是外部进程与JVM进程间通信的桥梁。</p>
<p>查阅官方文档,得到如下描述:</p>
<blockquote>
<p>The attach listener thread then communicates with the source JVM in an OS dependent manner: - On Solaris, the Doors IPC mechanism is used. The door is attached to a file in the file system so that clients can access it. - On Linux, a Unix domain socket is used. This socket is bound to a file in the filesystem so that clients can access it. - On Windows, the created thread is given the name of a pipe which is served by the client. The result of the operations are written to this pipe by the target JVM.</p>
</blockquote>
<p>证明了我们的猜想是正确的。目前为止check_socket函数的作用很容易理解了判断外部进程与目标JVM进程之间是否已经建立了UNIX Socket连接。</p>
<p>回到Main函数在使用check_socket确定连接尚未建立后紧接着调用start_attach_mechanism函数函数名很直观地描述了它的作用源码如下</p>
<pre><code>// async-profiler/src/jattach/jattach.c
// Force remote JVM to start Attach listener.
// HotSpot will start Attach listener in response to SIGQUIT if it sees .attach_pid file
static int start_attach_mechanism(int pid, int nspid) {
char path[MAX_PATH];
snprintf(path, MAX_PATH, &quot;/proc/%d/cwd/.attach_pid%d&quot;, nspid, nspid);
int fd = creat(path, 0660);
if (fd == -1 || (close(fd) == 0 &amp;&amp; !check_file_owner(path))) {
// Failed to create attach trigger in current directory. Retry in /tmp
snprintf(path, MAX_PATH, &quot;%s/.attach_pid%d&quot;, get_temp_directory(), nspid);
fd = creat(path, 0660);
if (fd == -1) {
return 0;
}
close(fd);
}
// We have to still use the host namespace pid here for the kill() call
kill(pid, SIGQUIT);
// Start with 20 ms sleep and increment delay each iteration
struct timespec ts = {0, 20000000};
int result;
do {
nanosleep(&amp;ts, NULL);
result = check_socket(nspid);
} while (!result &amp;&amp; (ts.tv_nsec += 20000000) &lt; 300000000);
unlink(path);
return result;
}
</code></pre>
<p>start_attach_mechanism函数首先创建了一个名为“/tmp/.attach_pid”的空文件然后向目标JVM进程发送了一个SIGQUIT信号这个信号似乎触发了JVM的某种机制紧接着start_attach_mechanism函数开始陷入了一种等待每20ms调用一次check_socket函数检查连接是否被建立如果等了300ms还没有成功就放弃。函数的最后调用Unlink删掉.attach_pid文件并返回。</p>
<p>如此看来HotSpot似乎提供了一种特殊的机制只要给它发送一个SIGQUIT信号并预先准备好.attach_pid文件HotSpot会主动创建一个地址为“/tmp/.java_pid”的UNIX Socket接下来主动Connect这个地址即可建立连接执行命令。</p>
<p>查阅文档,得到如下描述:</p>
<blockquote>
<p>Dynamic attach has an attach listener thread in the target JVM. This is a thread that is started when the first attach request occurs. On Linux and Solaris, the client creates a file named .attach_pid(pid) and sends a SIGQUIT to the target JVM process. The existence of this file causes the SIGQUIT handler in HotSpot to start the attach listener thread. On Windows, the client uses the Win32 CreateRemoteThread function to create a new thread in the target process.</p>
</blockquote>
<p>这样一来就很明确了在Linux上我们只需创建一个“/tmp/.attach_pid”文件并向目标JVM进程发送一个SIGQUIT信号HotSpot就会开始监听“/tmp/.java_pid”地址上的UNIX Socket接收并执行相关Attach的命令。至于为什么一定要创建.attach_pid文件才可以触发Attach Listener的创建经查阅资料我们得到了两种说法一是JVM不止接收从外部Attach进程发送的SIGQUIT信号必须配合外部进程创建的外部文件才能确定这是一次Attach请求二是为了安全。</p>
<p>继续看jattach的源码果不其然它调用了connect_socket函数对“/tmp/.java_pid”进行连接connect_socket源码如下</p>
<pre><code>// async-profiler/src/jattach/jattach.c
// Connect to UNIX domain socket created by JVM for Dynamic Attach
static int connect_socket(int pid) {
int fd = socket(PF_UNIX, SOCK_STREAM, 0);
if (fd == -1) {
return -1;
}
struct sockaddr_un addr;
addr.sun_family = AF_UNIX;
snprintf(addr.sun_path, sizeof(addr.sun_path), &quot;%s/.java_pid%d&quot;, get_temp_directory(), pid);
if (connect(fd, (struct sockaddr*)&amp;addr, sizeof(addr)) == -1) {
close(fd);
return -1;
}
return fd;
}
</code></pre>
<p>一个很普通的Socket创建函数返回Socket文件描述符。</p>
<p>回到Main函数主流程紧接着调用write_command函数向该Socket写入了从命令行传进来的参数并且调用read_response函数接收从目标JVM进程返回的数据。两个很常见的Socket读写函数源码如下</p>
<pre><code>// async-profiler/src/jattach/jattach.c
// Send command with arguments to socket
static int write_command(int fd, int argc, char** argv) {
// Protocol version
if (write(fd, &quot;1&quot;, 2) &lt;= 0) {
return 0;
}
int i;
for (i = 0; i &lt; 4; i++) {
const char* arg = i &lt; argc ? argv[i] : &quot;&quot;;
if (write(fd, arg, strlen(arg) + 1) &lt;= 0) {
return 0;
}
}
return 1;
}
// Mirror response from remote JVM to stdout
static int read_response(int fd) {
char buf[8192];
ssize_t bytes = read(fd, buf, sizeof(buf) - 1);
if (bytes &lt;= 0) {
perror(&quot;Error reading response&quot;);
return 1;
}
// First line of response is the command result code
buf[bytes] = 0;
int result = atoi(buf);
do {
fwrite(buf, 1, bytes, stdout);
bytes = read(fd, buf, sizeof(buf));
} while (bytes &gt; 0);
return result;
}
</code></pre>
<p>浏览write_command函数就可知外部进程与目标JVM进程之间发送的数据格式相当简单基本如下所示</p>
<pre><code>&lt;PROTOCOL VERSION&gt;\0&lt;COMMAND&gt;\0&lt;ARG1&gt;\0&lt;ARG2&gt;\0&lt;ARG3&gt;\0
</code></pre>
<p>以先前我们使用的Load命令为例发送给HotSpot时格式如下</p>
<pre><code>1\0load\0/absolute/path/to/agent/libagent.so\0true\0\0
</code></pre>
<p>至此我们已经了解了如何手工对JVM进程直接进行Attach。</p>
<h3>Attach补充介绍</h3>
<p>Load命令仅仅是HotSpot所支持的诸多命令中的一种用于动态加载基于JVMTI的Agent完整的命令表如下所示</p>
<pre><code>static AttachOperationFunctionInfo funcs[] = {
{ &quot;agentProperties&quot;, get_agent_properties },
{ &quot;datadump&quot;, data_dump },
{ &quot;dumpheap&quot;, dump_heap },
{ &quot;load&quot;, JvmtiExport::load_agent_library },
{ &quot;properties&quot;, get_system_properties },
{ &quot;threaddump&quot;, thread_dump },
{ &quot;inspectheap&quot;, heap_inspection },
{ &quot;setflag&quot;, set_flag },
{ &quot;printflag&quot;, print_flag },
{ &quot;jcmd&quot;, jcmd },
{ NULL, NULL }
};
</code></pre>
<p>读者可以尝试下threaddump命令然后对相同的进程进行jstack对比观察输出其实是完全相同的其它命令大家可以自行进行探索。</p>
<h2>总结</h2>
<p>总的来说善用各类Profiler是提升性能优化效率的一把利器了解Profiler本身的实现原理更能帮助我们避免对工具的各种误用。CPU Profiler所依赖的Attach、JVMTI、Instrumentation、JMX等皆是JVM平台比较通用的技术在此基础上我们去实现Memory Profiler、Thread Profiler、GC Analyzer等工具也没有想象中那么神秘和复杂了。</p>
<h2>参考资料</h2>
<ul>
<li><a href="https://docs.oracle.com/en/java/javase/12/docs/specs/jvmti.html">JVM Tool Interface</a></li>
<li><a href="https://psy-lob-saw.blogspot.com/2016/06/the-pros-and-cons-of-agct.html">The Pros and Cons of AsyncGetCallTrace Profilers</a></li>
<li><a href="https://psy-lob-saw.blogspot.com/2016/02/why-most-sampling-java-profilers-are.html">Why (Most) Sampling Java Profilers Are Fucking Terrible</a></li>
<li><a href="https://psy-lob-saw.blogspot.com/2015/12/safepoints.html">Safepoints: Meaning, Side Effects and Overheads</a></li>
<li><a href="https://openjdk.java.net/groups/hotspot/docs/Serviceability.html">Serviceability in HotSpot</a></li>
<li><a href="https://www.ruanyifeng.com/blog/2017/09/flame-graph.html">如何读懂火焰图?</a></li>
<li><a href="https://blog.jetbrains.com/idea/2018/09/intellij-idea-2018-3-eap-git-submodules-jvm-profiler-macos-and-linux-and-more/">IntelliJ IDEA 2018.3 EAP: Git Submodules, JVM Profiler (macOS and Linux) and more</a></li>
</ul>
</div>
</div>
<div>
<div style="float: left">
<a href="/文章/ElasticSearch 小白从入门到精通.md.html">上一页</a>
</div>
<div style="float: right">
<a href="/文章/JVM 垃圾收集器.md.html">下一页</a>
</div>
</div>
</div>
</div>
</div>
</div>
<a class="off-canvas-overlay" onclick="hide_canvas()"></a>
</div>
<script defer src="https://static.cloudflareinsights.com/beacon.min.js/v652eace1692a40cfa3763df669d7439c1639079717194" integrity="sha512-Gi7xpJR8tSkrpF7aordPZQlW2DLtzUlZcumS8dMQjwDHEnw9I7ZLyiOj/6tZStRBGtGgN6ceN6cMH8z7etPGlw==" data-cf-beacon='{"rayId":"70997fa9d8fb8b66","version":"2021.12.0","r":1,"token":"1f5d475227ce4f0089a7cff1ab17c0f5","si":100}' crossorigin="anonymous"></script>
</body>
<!-- Global site tag (gtag.js) - Google Analytics -->
<script async src="https://www.googletagmanager.com/gtag/js?id=G-NPSEEVD756"></script>
<script>
window.dataLayer = window.dataLayer || [];
function gtag() {
dataLayer.push(arguments);
}
gtag('js', new Date());
gtag('config', 'G-NPSEEVD756');
var path = window.location.pathname
var cookie = getCookie("lastPath");
console.log(path)
if (path.replace("/", "") === "") {
if (cookie.replace("/", "") !== "") {
console.log(cookie)
document.getElementById("tip").innerHTML = "<a href='" + cookie + "'>跳转到上次进度</a>"
}
} else {
setCookie("lastPath", path)
}
function setCookie(cname, cvalue) {
var d = new Date();
d.setTime(d.getTime() + (180 * 24 * 60 * 60 * 1000));
var expires = "expires=" + d.toGMTString();
document.cookie = cname + "=" + cvalue + "; " + expires + ";path = /";
}
function getCookie(cname) {
var name = cname + "=";
var ca = document.cookie.split(';');
for (var i = 0; i < ca.length; i++) {
var c = ca[i].trim();
if (c.indexOf(name) === 0) return c.substring(name.length, c.length);
}
return "";
}
</script>
</html>