Linux平台是使用最为广泛的服务器平台之一,不少Java端程序都运行在类Linux平台(如AIX、Solaris等)上。不同的类Linux操作系统的很多命令都非常相似,不少命令仅有一些细节上的差异。本节主要介绍用于Linux平台的性能收集和统计工具。
top命令的输出结果可以分为两个部分: 前半部分是系统统计信
息, 后半部分是进程信息。
在统计信息中, 第1行是任务队列信息, 它的结果等同于uptime命
令。 从左到右依次表示: 系统当前时间、 系统运行时间、 当前登录用户
数及系统的平均负载(使用load average表示) 。 系统的平均负载即任务
队列的平均长度, 这3个值分别表示1min、 5min、 15min到现在的平均
值。
第2行是进程统计信息, 包括总进程数、 正在运行的进程数、 睡眠
进程数、 停止的进程数和僵尸进程数。 第3行是CPU的统计信息: us表
示用户空间CPU占用率; sy表示内核空间CPU占用率; ni表示用户进程
(改变过优先级的进程) CPU占用率; id表示空闲CPU占用率; wa表示
等待输入/输出的CPU时间百分比; hi表示硬件中断请求的CPU时间百分
比; si表示软件中断请求的CPU时间百分比; st表示在虚拟机中运行时
等待CPU的时间。 在Mem行中, 从左到右依次表示物理内存总量、 已使
用的物理内存、 空闲物理内存和内核缓冲的使用量。 Swap行依次表示
交换区总量、已使用的交换区大小、空闲交换区大小和缓冲交换区大小。
top命令输出结果的后半部分是进程信息区,显示系统内各个进程的资源使用情况。在Top命令的输出结果中,可能出现的列及其含义如下(因为代码或开发环境不同,以下列不一定全部显示):
在top命令下按F键可以进行列的选择,按O键可以更改列的显示顺序。此外,top命令还有以下一些实用的交互指令。
注意:使用top命令可以从宏观上观察系统的各个进程对CPU的占用情况及内存使用情况。
sar命令也是Linux系统中重要的性能监测工具之一,它可以周期性地对内存和CPU使用情况进行采样。基本语法如下:
interval和count分别表示采样周期和采样数量。options选项可以指定sar命令对哪些性能数据进行采样(不同版本的sar命令选项可能有所不同,可以通过sar-h命令查看)。
下面的代码使用sar命令统计CPU的使用情况,每秒采样一次,共采样3次。
下面的代码用于获取内存的使用情况。
下面的代码用于获取I/O信息。
注意:sar命令可以查看I/O信息、内存信息及CPU的使用情况。
vmstat也是一款功能比较齐全的性能监测工具,它可以统计CPU、内存及swap的使用情况等信息。和sar工具类似,vmstat也可以指定采样周期和采样次数。下面的代码表示每秒采样一次,共计3次。
输出结果中,各列含义如表所示。
vmstat命令输出结果的含义
以下代码显示了一个线程切换频繁的Java程序。
使用vmstat工具监控上述Java程序的执行情况:
通过加粗部分可以看到,系统有着很高的cs值(上下文切换)和us值(用户CPU使用时间),表明系统的上下文切换频繁,用户CPU占用率很高。
注意:vmstat工具可以查看内存、交互分区、I/O操作、上下文
切换、时钟中断及CPU的使用情况。
iostat命令可以提供详尽的I/O信息。它的基本使用方式如下:
以上命令显示了CPU的使用概况和磁盘I/O的信息。对输出信息每秒采样1次,合计采样两次。如果只需要显示磁盘情况,不需要显示CPU使用情况,则可以使用以下命令:
-d 表示输出磁盘的使用情况。在输出结果中,各个列的含义如下:
如果需要得到更多的统计信息,可以使用-x选项。例如:
注意:磁盘I/O很容易成为系统性能的瓶颈。通过iostat命令可以
快速定位系统是否产生了大量的I/O操作。
pidstat是一个功能强大的性能监测工具,它也是Sysstat的组件之一。读者可以
在
http://www.icewalkers.com/Linux/Software/59040/Sysstat.html上下载这个工具。下载后,通过./configure、make和makeinstall三个命令即可安装pidstat工具。pidstat的强大之处在于,它不仅可以监视进程的性能情况,也可以监视线程的性能情况。本小节将详细介绍pidstat的功能。
1.CPU使用率监控
下面是一个简单的占用CPU的程序,它开启了4个用户线程,其中1个线程大量占用CPU资源,其他3个线程则处于空闲状态。
运行以上程序,要监控该程序的CPU使用率,可以先使用jps命令找到Java程序的PID,然后使用pidstat命令输出程序的CPU使用情况。执行命令如下:
其中,pidstat的参数-p用于指定进程ID,-u表示对CPU使用率的监控,最后的参数1和3分别表示每秒采样1次与合计采样3次。从输出结果中可以看到,该应用程序的CPU占用率几乎达到100%。pidstat的功能不仅限于观察进程信息,它还可以进一步监控线程的信息,执行命令如下:
该命令的部分输出结果如下:
-t参数将系统性能的监控细化到线程级别。从输出结果中可以看到,该Java应用程序之所以占用如此高的CPU,是因为线程1204的缘故。
注意:使用pidstat工具不仅可以定位到进程,甚至可以进一步定位到线程。
使用以下命令可以导出指定Java应用程序的所有线程。
在输出的t.txt文件中可以找到这样一段输出内容:
从加粗的文字可以看到,这个线程正是HoldCPUTask类,它的nid(nativeID)为0x4b4,转为十进制后正好是1204。
通过这个方法,开发人员可以使用pidstat很容易地捕获在Java应用程序中大量占用CPU的线程。
2.I/O使用监控
磁盘I/O也是常见的性能瓶颈之一。使用pidstat也可以监控进程内线程的I/O情况。下面的代码开启了4个线程,其中,线程HoldIOTask产生了大量的I/O操作。
在程序运行过程中,使用以下命令监控程序I/O的使用情况:
其中,22796是通过jps命令查询到的进程ID,-d参数表明监控对象为磁盘I/O,1和3分别表示每秒采样1次,合计采样3次。
从输出结果中可以看到,进程中的22813(0x591D)线程产生了大量的I/O操作。通过前文中提到的jstatck命令可以导出当前线程的堆栈,查找nid为22813(0x591D)的线程,即可定位到HoldIOTask线程。
注意:使用pidstat命令可以查看进程和线程的I/O信息。
3.内存监控
使用pidstat命令还可以监控指定进程的内存使用情况。下面的代码使用pidstat工具对进程ID为27233的进程进行内存监控,每秒刷新1次,共进行5次统计。
输出结果中各列含义如下:
注意:pidstat工具是一款多合一的优秀工具,它不仅可以监控CPU、I/O和内存资源,甚至可以将问题定位到相关线程,以方便进行应用程序故障排查。