[转帖]Java FlameGraph 火焰图

java,flamegraph,火焰 · 浏览次数 : 0

小编点评

**1. FlameGraph 简介** - SVG 格式,矢量图,可以随意放大缩小。 - 各种红橙黄色没有什么意义,仅做区分用。 - x轴横条宽度来度量时间指标。 - y轴代表线程栈的层次,从最底下往上表示堆栈的层层调用。 **2. 生成火焰图的步骤** - 1. 需要 java profiler 生成 trace 文件。 - 2. 将 trace 文件转换为 svg 格式的火焰图文件。 **3. Java profiler** - 采样工具选取:xprof、hprof、jprofiler 和 yourkit 四种采样器。 - 不同采样器会注入不同的代码,影响程序优化过程。 - honest-profiler 避开了通过 SUN/Oracle management agent 去采样堆栈,提升了采样准确率。

正文

http://www.wjhsh.net/xingzifei-p-7446264.html

 

上周一个偶然的机会听同事提到了Java FlameGraph,刚实验了一下,效果非常好。

一、什么是FlameGraph

直接看图说话。FlameGraph 是 SVG格式,矢量图,可以随意扩大缩小,看不清的信息可以放大看。图中,各种红橙黄色没有什么意义,仅仅做区分用;x轴横条宽度来度量时间指标,表明每个接口实际占用的CPU时间;y轴代表线程栈的层次,从最底下往上表示堆栈的层层调用。通过看图,可以发现哪个接口占用的CPU时间较多,从而优化;同时,可以发现调用关系。

Java火焰图的作者是Brendan Gregg,他的博客非常有意思,很多关于性能的分析。以下链接是对每个类别的火焰图的详细说明。

什么是Java Flame Graphs:Java Flame Graphs

On-CPU:CPU Flame Graphs

Off-CPU:Off-CPU Flame Graphs

Memory:Memory Leak (and Growth) Flame Graphs

Hot/Cold:Hot/Cold Flame Graphs

Differential:Differential Flame Graphs

关于火焰图的PPT(讲解得非常详细):Blazing Performance with Flame Graphs

二、如何生成

两个步骤:1. 需要java profiler生成trace文件  2. 将trace文件转换为svg格式的火焰图文件。

1. 需要java profiler生成trace文件

在使用Profiler对CPU进行采样时,根据CPU当前执行所处栈位置以及各个函数栈在总的采样次数所占比例就可以得出各个函数执行时的CPU占用比例。常用的是lightweight-java-profiler。还有其他的选择,比如honest-profiler,lightweight-java-profiler会从java虚拟机启动开始采样,而有时候我们需要在CPU飙高的时候开始,这时候honest-profiler提供的动态启停功能就有用武之地了。也有使用perf生成火焰图。(*perf 要研究一下)

下面以lightweight-java-profiler 举例

(1) 从github下载软件

(2) 编译 make all

(3) 生成的程序存放在build-64文件夹下面

(4)(可选)可以更改一些lightweight-java-profiler的一些选项,打开src/globals.h文件。在长时间采样时,可以适当地减少每秒采样次数,不然最终生成的文件会很大,分析起来比较麻烦。

// 每秒采样频率
static const int kNumInterrupts = 100;
// Maximum number of stack traces线程栈个数
static const int kMaxStackTraces = 3000;
// 采样栈深度
static const int kMaxFramesToCapture = 128;  

  kNumInterrupts: 每秒钟抽取样本的次数;

  kMaxStackTraces: 线程栈的最大数量   

  kMaxFramesToCapture: 线程栈的深度

(5)运行Java程序

  java -agentpath:path/to/liblagent.so ......

(6)java程序启动后会在当前目录生成一个traces.txt文件,但文件中只有一些说明信息。程序正常结束(不杀掉进程)后,才会写入具体采样信息。

2.将trace文件转换为svg格式的火焰图文件。

(1)从github下载FlameGraph

(2)转换 

  ./stackcollapse-ljp.awk < traces.txt | ./flamegraph.pl > traces.svg
(3)浏览器中打开traces.svg文件
 
 
 
三、简单讨论一下Java profiler
 
关于采样工具的选取,可以看看文章 Evaluating the Accuracy of Java Profilers ,这里面列举了xprof,hprof,jprofile和yourkit四种采样器,并通过几个压测场景证明了这几种采样器的结果是相互矛盾的。总结的原因有两点:
1. 采样器采样点不够随机,这几种采样器都只有在safe point采样;
2. 不同的采样器会注入不同的代码,从而影响程序优化过程,同时也影响了safe point的分布,进一步造成采样差异;
honest-profiler号称是避开了通过SUN/Oracle management agent去采样堆栈,而是使用自己实现的使用UNIX 操作系统信号和为Oracle Performance Studio 设计的内部API的sampling agent,从而提升了采样准确率。
 
还有一篇文章和 Why many profilers have serous problems。
 
Java profiler 的两个常见方式:
1.修改代码,从而实现采样。问题是:1. 增加开销;2. 修改了你的代码,导致java编译器的优化行为不确定;3. 影响了代码的层次,层次越深自然也影响 执行效率。
2.通过获取on-cpu线程的线程栈方式。问题是:获取系统范围的线程栈,jvm必须处于safepoint状态(看文章What is Java safepoint)。只有当线程处于safepoint状态的时候,别的线程才能去获取它的线程栈,而这个safepoint是由jvm 控制的,这对于profiler非常不利,有可能一个很热的代码块,jvm不会在该代码块中间放置safepoint,导致profiler无法获得该线程栈,导致错误的profiler结果。

几个商用的profiler工具都存在上述问题。但是,Oracle Solaris studio利用的是jvmti的一个非标准接口AsyncGetCallTrace来实现,不存在上面问题,Jeremy Manson也利用该接口 实现了一个简单的profiler工具:lightweight-java-profiler。

 
 
 
相关知识:
 部分内容摘自 http://blog.csdn.net/c395318621/article/details/55224665
 部分内容摘自 http://tacy.github.io/blog/2014/07/16/FlameGraph/
 部分内容摘自 http://www.javashuo.com/content/p-6579579.html
 部分内容摘自 http://colobu.com/2016/08/10/Java-Flame-Graphs/
 文章: Evaluating the Accuracy of Java Profilers  
 文章: Why many profilers have serous problems。
 文章: What is Java safepoint

与[转帖]Java FlameGraph 火焰图相似的内容:

[转帖]Java FlameGraph 火焰图

http://www.wjhsh.net/xingzifei-p-7446264.html 上周一个偶然的机会听同事提到了Java FlameGraph,刚实验了一下,效果非常好。 一、什么是FlameGraph 直接看图说话。FlameGraph 是 SVG格式,矢量图,可以随意扩大缩小,看不清的

[转帖]C++:perf详解 + Flame Graph火焰图分析程序性能

因为项目需求,C++和java同时在搞,最近了解到Flame Graph火焰图这个工具,网上查了查资料,这里记录一下。 1 介绍 web site http://www.brendangregg.com/flamegraphs.html git: https://github.com/brendan

[转帖]CPU Flame Graphs

https://www.brendangregg.com/FlameGraphs/cpuflamegraphs.html#Java MySQL CPU Flame Graph Determining why CPUs are busy is a routine task for performanc

[转帖]Java 近期新闻:JEP 更新,GraalVM 贡献给 OpenJDK,JavaOne 重启

https://www.infoq.cn/article/kzzbQg5zgissaCcJlfey JEP 432记录模式(第二预览版)在上周从其 8294078 草案晋升为候选状态。相比 JEP 405 记录模式(预览版),该 JEP 更新了:对通用记录模式类型参数推断的支持、新增对记录模式出现在

[转帖]Java中线程的生命周期

https://blog.51cto.com/u_15773567/5832430 1 介绍 本篇文章我们讨论下Java中的一个非常核心的概念:线程的生命周期。在Java编程语言中,多线程编程非常重要。线程从创建到销毁是有生命周期的,在线程的生命周期中,线程会经历多种状态(state)。 2 线程状

[转帖]Java调优系列之工具篇之btrace、gperftools

https://github.com/landon30/Bulls/wiki/java-profiling-tools landon 网络游戏资深服务器架构师 2018-06-14 线上遇到了问题? 服务上线出问题,想增加打印日志怎么办? 线上怀疑某个接口慢,想打印接口耗时怎么办? 线上某个接口报错

[转帖]Java游戏服务器调优实践

https://www.jianshu.com/p/344f8141b63e Java Profiling Practice landon资深网络游戏服务器架构师 系统性能定义 Throughput 吞吐量,也就是每秒钟可以处理的请求数,任务数 Latency 系统延迟,也就是系统在处理一个请求或一

[转帖]java中方法不要写太长的真正原因

https://www.iteye.com/blog/enetor-976070 java中一般建议一个方法不要写的过长,不方便维护和阅读是其中的一个原因,但是其真正性能的原因大家知道吗? 我们知道,JVM一开始是以解释方式执行字节码的。当这段代码被执行的次数足够多以后,它会被动态优化并编译成机器码

[转帖]Java方法的JIT编译

https://www.jianshu.com/p/a6275e239eac Java方法执行一般会利用分层编译,先通过c1解释执行。方法执行编译等级逐渐提升,有机会通过JIT编译为特定平台汇编执行,以此获得最好的性能。 方法执行除了达到一定热度外,是否JIT编译也受到以下两个参数影响: -XX:+

[转帖]java profile配置