JVM 堆外内存查看方法
1.概述
是否曾经想过为什么Java应用程序通过众所周知的*-Xms和-Xmx调整标志消耗的内存比指定的数量大得多 ?由于各种原因和可能的优化,JVM可能会分配额外的本机内存。这些额外的分配最终可能使消耗的内存超出-Xmx* 限制。
在本教程中,我们将枚举JVM中本机内存分配的一些常见来源,以及它们的大小调整标志,然后学习如何使用本机内存跟踪来监视它们。
2.本机分配
通常,堆是Java应用程序中最大的内存消耗者,但是还有其他一些。**除了堆之外,JVM从本地内存中分配了相当大的块来维护其类元数据,应用程序代码,由JIT生成的代码,内部数据结构等。**在以下各节中,我们将探讨其中的一些分配。
可以看到整个memory主要包含了Java Heap、Class、Thread、Code、GC、Compiler、Internal、Other、Symbol、Native Memory Tracking、Arena Chunk这几部分;其中reserved表示应用可用的内存大小,committed表示应用正在使用的内存大小
Java Heap部分表示heap内存目前占用了463MB;
Class部分表示已经加载的classes个数为8801,其metadata占用了50MB;
Thread部分表示目前有225个线程,占用了27MB;
Code部分表示JIT生成的或者缓存的instructions占用了17MB;
GC部分表示目前已经占用了15MB的内存空间用于帮助GC;
Compiler部分表示compiler生成code的时候占用了26MB;
Internal部分表示命令行解析、JVMTI等占用了5MB;
Other部分表示尚未归类的占用了2MB;
Symbol部分表示诸如string table及constant pool等symbol占用了10MB;
Native Memory Tracking部分表示该功能自身占用了5MB;
Arena Chunk部分表示arena chunk占用了63MB
一个arena表示使用malloc分配的一个memory chunk,这些chunks可以被其他subsystems做为临时内存使用,比如pre-thread的内存分配,它的内存释放是成bulk的
2.1 元空间 Class
为了维护有关已加载类的某些元数据,JVM使用了称为*Metaspace的专用非堆区域。在Java 8之前,等效项称为PermGen或Permanent Generation*。Metaspace或PermGen包含有关已加载类的元数据,而不是包含在堆中的有关它们的实例的元数据。
这里重要的是,由于元空间是堆外数据区域,因此堆大小调整配置不会影响元空间的大小。为了限制元空间的大小,我们使用其他调整标志:
- -XX:MetaspaceSize和-XX:MaxMetaspaceSize设置最小和最大元空间大小
- 在Java 8之前,使用*-XX:PermSize和-XX:MaxPermSize*来设置最小和最大PermGen大小
2.2 线程数 Thread
JVM中最消耗内存的数据区域之一是堆栈,它与每个线程同时创建。堆栈存储局部变量和部分结果,在方法调用中起着重要作用。
默认的线程堆栈大小取决于平台,但是在大多数现代的64位操作系统中,大约为1 MB。此大小可通过*-Xss *调整标志进行配置。
与其他数据区域相比,当对线程数没有限制时,分配给堆栈的总内存实际上是不受限制的。 还值得一提的是,JVM本身需要一些线程来执行其内部操作,例如GC或即时编译。
2.3 代码缓存 Code
为了在不同平台上运行JVM字节码,需要将其转换为机器指令。在执行程序时,JIT编译器负责此编译。
JVM将字节码编译为汇编指令时,会将这些指令存储在称为*代码缓存***的特殊非堆数据区域中 。 可以像JVM中的其他数据区域一样管理代码缓存。-XX:InitialCodeCacheSize **和 **-XX:ReservedCodeCacheSize **调谐标志确定用于代码高速缓存中的初始和最大可能大小。
2.4 垃圾收集 GC
JVM附带了几种GC算法,每种算法都适合不同的用例。所有这些GC算法都有一个共同的特征:它们需要使用一些堆外数据结构来执行任务。这些内部数据结构消耗更多的本机内存。
2.5 Symbols
让我们从字符串开始 , 它是应用程序和库代码中最常用的数据类型之一。由于它们无处不在,因此它们通常占据堆的很大一部分。如果大量的这些字符串包含相同的内容,那么堆的很大一部分将被浪费。
为了节省一些堆空间,我们可以存储每个String的一个版本, 并让其他版本引用存储的版本。 此过程称为字符串实习。由于JVM只能内生 编译时间字符串常量,因此 我们可以对要内生的字符串手动调用intern() 方法。
JVM将内联的字符串存储在特殊的本机固定大小的哈希表中,该哈希表称为String Table,也称为String Pool。我们可以通过**-XX:StringTableSize** 调整标志来配置表的大小(即桶数) 。
除了字符串表外,还有另一个本机数据区域,称为运行时常量池。 JVM使用此池存储必须在运行时解析的常量,例如编译时数字文字,方法和字段引用。
2.6 本机字节缓冲区 Native Byte Buffers
JVM通常是大量本机分配的可疑对象,但有时开发人员也可以直接分配本机内存。最常见的方法是通过JNI和NIO的直接ByteBuffers进行**malloc **调用 。
2.7 Additional Tuning Flags
在本节中,我们针对不同的优化方案使用了少数JVM调整标志。使用以下技巧,我们几乎可以找到与特定概念相关的所有调整标志:
$ java -XX:+PrintFlagsFinal -version | grep <concept>
该PrintFlagsFinal打印所有- *XX *在JVM选项。例如,要查找所有与Metaspace相关的标志:
$ java -XX:+PrintFlagsFinal -version | grep Metaspace // truncated uintx MaxMetaspaceSize = 18446744073709547520 {product} uintx MetaspaceSize = 21807104 {pd product} // truncated
3.本机内存跟踪(NMT)
既然我们知道了JVM中本机内存分配的常见来源,那么该是时候找出如何监视它们了。**首先,我们应该使用另一个JVM调整标志启用本地内存跟踪:*-XX:NativeMemoryTracking = off | sumary | detail。 ***默认情况下,NMT处于关闭状态,但我们可以使它查看其观测结果的摘要或详细视图。
假设我们要跟踪典型的Spring Boot应用程序的本机分配:
$ java -XX:NativeMemoryTracking=summary -Xms300m -Xmx300m -XX:+UseG1GC -jar app.jar
在这里,我们使用G1作为GC算法,在分配300 MB堆空间的同时启用NMT。
3.1 即时快照
启用NMT后,我们可以随时使用*jcmd *命令获取本机内存信息 :
$ jcmd <pid> VM.native_memory
为了找到JVM应用程序的PID,我们可以使用 jps命令:
$ jps -l 7858 app.jar // This is our app7899 sun.tools.jps.Jps
现在,如果我们将 jcmd *与适当的*pid一起使用, *VM.native_memory *将使JVM打印出有关本机分配的信息:
$ jcmd 7858 VM.native_memory
让我们逐节分析NMT输出。
3.2。总分配
NMT报告保留和提交的内存总量,如下所示:
Native Memory Tracking:Total: reserved=1731124KB, committed=448152KB
保留的内存代表我们的应用程序可能使用的内存总量。相反,已提交的内存等于我们的应用程序当前正在使用的内存量。
尽管分配了300 MB的堆,但我们的应用程序的总保留内存几乎为1.7 GB,远不止于此。同样,已提交的内存大约为440 MB,这又远远超过了300 MB。
在合计部分之后,NMT报告每个分配源的内存分配。因此,让我们深入探讨每个来源。
3.3 堆
NMT按预期报告了我们的堆分配:
Java Heap (reserved=307200KB, committed=307200KB) (mmap: reserved=307200KB, committed=307200KB)
300 MB的保留和提交内存,与我们的堆大小设置匹配。
3.4 元空间
NMT关于已加载类的类元数据的说明如下:
Class (reserved=1091407KB, committed=45815KB) (classes #6566) (malloc=10063KB #8519) (mmap: reserved=1081344KB, committed=35752KB)
保留了将近1 GB的空间,并有45 MB的空间用于加载6566类。
3.5 线程
这是关于线程分配的NMT报告:
Thread (reserved=37018KB, committed=37018KB) (thread #37) (stack: reserved=36864KB, committed=36864KB) (malloc=112KB #190) (arena=42KB #72)
总共为37个线程的堆栈分配了36 MB的内存–每个堆栈几乎1 MB。JVM在创建时将内存分配给线程,因此保留和提交的分配是相等的。
3.6 代码缓存
让我们看看NMT对JIT生成和缓存的汇编指令的评价:
Code (reserved=251549KB, committed=14169KB) (malloc=1949KB #3424) (mmap: reserved=249600KB, committed=12220KB)
当前,将近有13 MB的代码被缓存,并且该数量可能会增加到大约245 MB。
3.7 GC
这是有关G1 GC内存使用情况的NMT报告:
GC (reserved=61771KB, committed=61771KB) (malloc=17603KB #4501) (mmap: reserved=44168KB, committed=44168KB)
我们可以看到,几乎有60 MB的空间被保留并致力于帮助G1。
让我们看看一个简单得多的GC(例如串行GC)的内存使用情况:
$ java -XX:NativeMemoryTracking=summary -Xms300m -Xmx300m -XX:+UseSerialGC -jar app.jar
串行GC几乎不使用1 MB:
GC (reserved=1034KB, committed=1034KB) (malloc=26KB #158) (mmap: reserved=1008KB, committed=1008KB)
显然,我们不应该仅仅因为内存使用率就选择了GC算法,因为串行GC的“停滞不前”性质可能会导致性能下降。但是,有几个GC可供选择,它们的内存和性能平衡各不相同。
3.8 符号Symbol
这是有关符号分配的NMT报告,例如字符串表和常量池:
Symbol (reserved=10148KB, committed=10148KB) (malloc=7295KB #66194) (arena=2853KB #1)
将近10 MB分配给符号。
3.9 随着时间的NMT
**NMT使我们能够跟踪内存分配如何随时间变化。**首先,我们应将应用程序的当前状态标记为基线:
$ jcmd <pid> VM.native_memory baseline
然后,过一会儿,我们可以将当前内存使用量与该基准进行比较:
$ jcmd <pid> VM.native_memory summary.diff
NMT使用+和–符号将告诉我们在此期间内存使用量如何变化:
Total: reserved=1771487KB +3373KB, committed=491491KB +6873KB- Java Heap (reserved=307200KB, committed=307200KB) (mmap: reserved=307200KB, committed=307200KB) - Class (reserved=1084300KB +2103KB, committed=39356KB +2871KB)// Truncated
保留和提交的总内存分别增加了3 MB和6 MB。可以很容易地发现内存分配中的其他波动。
3.10 详细的NMT
NMT可以提供有关整个内存空间映射的非常详细的信息。要启用此详细报告,我们应该使用*-XX:NativeMemoryTracking = detail *调整标志。
4 结论
在本文中,我们列举了JVM中本机内存分配的不同贡献者。然后,我们学习了如何检查正在运行的应用程序以监视其本机分配。借助这些见解,我们可以更有效地调整应用程序并调整运行时环境的大小。