Linux服务器的性能监控与分析

linux,服务器,性能,监控,分析 · 浏览次数 : 389

小编点评

## VMStat 分析性能信息 **vmstat 1:** | 指标 | 值 | 说明 | |---|---|---| | r | 11.1 | 用户模式CPU占用比为 11.1% | | s | 5.0 | 系统模式CPU占用比为 5.0% | | ni | 0.1 | 改变过优先级的进程的CPU占用比为 0.1% | | id | 83.2 | 空闲状态的 CPU占用比为 83.2% | | si | 0.3 | 因为 I/O 等待造成的 CPU占用比为 0.3% | | st | 0.0 | CPU等待虚拟机调度的时间占比为 0.0% | **vmstat 10:** | 指标 | 值 | 说明 | |---|---|---| | r | 352 | 总进程数量为 352 | | s | 298 | 运行状态的进程数量为 298 | | st | 0 | 进程停止数量为 0 | | si | 0 | 改变过优先级的进程数量为 0 | | id | 0 | 空闲状态的 CPU 占用比为 0 | | hi | 0.3 | 硬中断的 CPU 占用比为 0.3% | | si | 0.0 | 软中断的 CPU 占用比为 0.0% |

正文

通过vmstat分析性能

如上图所示，我们在命令vmstat后面添加了两个参数，1表示间隔一秒获取一次，10表示总共获取10次

我们一列一列数据来看：

r：代表目前实际运行的指令队列，很高表示CPU很繁忙通常会CPU使用率过高
- 这个数据如果高于服务器CPU核数就可能出现瓶颈（需要结合后五列CPU使用百分比）
- 超过CPU核数的3个就比较高，超过5个已经很高，超过10个就比较危险了
b：目前因为等待资源而阻塞运行指令，比如等待I/O，内存交换、CPU资源瓶颈
swpd：表示虚拟内存（swap）已使用的大小。当服务器物理内存不够用时候，会把物理内存的部分空间释放出来，以供急需物理内存的来运行的程序使用，而从物理内存释放出来的一般是很长时间没有实际运行的程序。被保存到虚拟内存的内容等到运行起来，会从虚拟内存中恢复到物理内存。swpd大于0，不代表物理内存不够用了，需要结合si和so，如果si和so为0，表示物理内存是够用的
free：空闲的物理内存
buff：系统缓冲区的内存大小，只有对块设备读写才会需要缓冲区
cache：给已经打开的文件作为缓存的内存大小
si：每秒从虚拟内存读到内存中的数据大小，如果这个值长期大于0，表示物理内存不够用了
so：每秒写入虚拟内存的数据内容大小
bi和bo：表示每秒块设备读写，bi和bo两个值越大，CPU在I/O等待的值越大
in：CPU中断次数
cs：CPU每秒上下文切换次数，这值要越小越好，太大了要考虑调低线程和进程数量。上下文切换次数过多会让CPU大部分时间都浪费在上下文切换上，CPU正经运行就少了，CPU没有充分被利用。
us：用户模式CPU使用时间百分比，越高越好，说明CPU被充分利用了
sy：系统内核执行时间百分比，太高说明系统内核消耗CPU资源多
id：表示空闲空闲CPU占比，一般id + us + sy =100
wa：表示I/O等待时间百分比，越高说明I/O等待情况严重
st：改值一般都是0，一般在虚拟机中才会有

通过mpstat分析性能

如上图所示，我们在命令mpstat后面添加了两个参数，1表示间隔一秒获取一次，10表示总共获取10次

%usr：用户模式下CPU使用时间的百分比，和vmstat中us数据基本一致
%nice：CPU进程优先级调度占用的时间，这个值一般都是0，只有修改过默认优先级才会显示
%sys：表示系统内核进程执行时间百分比（system time）。该值越高，说明系统内核消耗的CPU资源越多，和vmstat命令中的sy数据基本一致。
%iowait：表示I/O等待时间的百分比。该值越高，说明IO等待越严重，和vmstat命令中的wa数据基本一致。
%irq：表示用于处理系统中断的CPU百分比。和vmstat命令中的in数据的含义类似。in越高，%irq也会越高。
%soft：表示用于软件中断的CPU百分比
%steal：表示CPU等待虚拟机调度的时间占比。这个指标一般在虚拟机中才会有，物理机中该值一般维持为0，和vmstat命令中的st数据基本一致。
%idle：表示空闲CPU时间的占比。和vmstat命令中的id数据基本一致

通过pidstat分析性能

UID：用户id
PID：进程id
%usr：进程对用户模式CPU使用的时间
%system：进程对系统模式CPU使用的时间
CPU：执行指定进程的CPU编号
Command：当前进程运行命令

通过free看内存

total：显示系统总的物理内存和交换区大小单位是k
used：显示已经被使用的物理内存和交换区大小单位是k
free：显示还有多少未使用的物理内存和交换区单位是k
shared：显示共享区占用的物理内存大小单位是k
buff/cache：缓冲区和缓存合计使用的内存大小单位是k
available列：显示的是可用物理内存的大小，单位为k。通常情况下，available的值等于free+buff/cache。

通过top系统情况

第一行显示的是系统运行信息：系统时间20:04:16秒、系统运行了12天、当前登陆用户2个、系统平均负载：4.75（1分钟平均负载压力），2.83（5分钟平均负载压力），2.02（15分钟平均负载压力）（这个数值除以CPU核数得到的值大于3-5时，系统负载就超高了）
第二行显示任务信息：总进程352,1个运行状态，298个休眠中，0个停止，0个假死
第3行显示的是CPU的运行信息： 11.1us表示用户模式下CPU占用比为11.1%，5.0 sy表示系统模式下CPU占用比为5.0%，0.1 ni表示改变过优先级的进程的CPU占用比为0.1%，83.2 id表示空闲状态的CPU占用比为83.2%，0.3 wa表示因为I/O等待造成的CPU占用比为0.3%，0.0 hi表示硬中断的CPU占用比，0.3 si表示软中断的CPU的占用比。0.0 st表示CPU等待虚拟机调度的时间占比，这个指标一般在虚拟机中才会有，在物理机中该值一般维持为0。
第4行显示的是内存的使用信息：total表示物理内存的总量，free表示物理内存的空闲大小，198808 used表示已使用的物理内存的大小，buff/cache表示用于缓存的物理内存的大小。
第5行显示的是虚拟内存（swap）的使用信息： total表示虚拟内存空间的大小， free表示空闲的虚拟内存空间的大小， used表示已使用的虚拟内存空间的大小， avail Mem表示可供使用的内存大小。
第7行显示的是每个进程的资源消耗信息
- %CPU：进程运行时CPU占用比
- %MEM：进程使用的内存占用比
- TIME+：进程占用CPU总时长
- COMMAND：正在运行的命令

友情链接

https://www.cnblogs.com/yetangjian/p/15705398.html