https://aijishu.com/a/1060000000216862
这两天我手头正好有一台配置较高的工作站,2颗Xeon Gold 6258R 28核CPU、1TB(1024GB)内存,跑了下功耗压测。
在Windows下我习惯用AIDA64、Hwinfo这些监控软件。Linux下能看CPU温度和频率的工具也有一些,而此次我还要同时监控功耗,另外要是再有个简单的图形界面就更好了。在网上搜了一下,找到s-tui,发现还挺好用,顺手分享给大家。
s-tui是一款开源软件,关于它的简介和安装方法可以参考《s-tui:在 Linux中监控 CPU 温度、频率、功率和使用率的终端工具》。
本次我是在Ubuntu下安装使用,具体的步骤比较简单:
$ sudo apt installpython-pip stress
$ sudo pip installs-tui(如果是Python 3.x,替换“pip”为“pip3”)
$ sudo s-tui
图片点开后可放大(以下同)
上图是空载情况下(准确地说是把压力停了一会)的s-tui界面。柱状图从上到下依次显示:温度、频率、CPU占用率、功耗和风扇转速。
-温度:用红框标出的Pa(Package)显示CPU封装温度,Co代表各个核心温度;
-频率:红框标出的A(Avg)显示平均频率,C代表各个Core的频率;
-占用率:A(Avg)显示整体占用率,C代表各个Core占用率;
-功率:package-0,0 / 1,0分别显示2颗CPU功耗,dram,0、dram,1对应各自内存控制器所插的内存(注:由于Dell Precision 7920 Tower工作站多达24个DIMM槽,内存功耗这项监控不准);
-风扇转速:nouveau,0应该代表显卡(未安装NV驱动,也不一定准),dell_smm,1/ 2不知读取的机箱内哪2个风扇,这里仅作为一般参考。
图中左下方的Summaries是经过我筛选后列出的实时监控数字。由于测试机CPU核心数较多,因此默认设置在这里不能显示全,可进入上面Control Option对应的选项设置一下,如下图:
s-tui是基于Linux字符终端呈现,把上面的选项改成这样我也费了一番功夫。
CPU频率全核满载保持2.1GHz,后面我来讨论下是否达标?
当我把prime95压测软件跑起来,2颗Xeon 6258R CPU一开始可以到230W功耗,稳定后保持在205W TDP附近。2颗CPU封装的温度分别为70℃和78℃(室温25摄氏度左右);此时风扇转速有一定提高,我们看到dell_smm,1读数从800转提高到2596转。当然工作站整体上肯定比服务器静音,各风扇还没有到全速。
注:这里的温度读数来自CPU内部温度传感器,而CPU表面实际温度比这个要低。详情参见《Xeon Scalable CPU跑到90℃了:为什么风扇转速还不提高?》。
如果是服务器,我要想监控全部风扇转速的途径是BMC(如:iDRAC)管理。但塔式工作站的情况不同,没有BMC,但有另一个办法——启动时按F12,然后进入诊断界面。这时如果插满1TB内存,等待的时间会比较长,因为涉及到对系统各组件的检测,完成后我们进入下图的界面:
在《双Xeon SP只用一个风扇?Percision 7920工作站散热设计解析》中我介绍过这款主机的散热设计。除了CPU1 FAN之外,4个SYS FAN用于机箱前部进风,2个REAR FAN专用于CPU和内存风罩区域的排风,如果满配硬盘的话FB FAN的数量应该还可以多2个。
在SupportAssist | Pre-Boot System Performance Check界面的进一步测试选项中,可以看到内存测试就有若干项目。这个对售后工程师比较有用,在怀疑故障可能与操作系统/软件因素有关时,可以用来初步判断硬件是否正常工作。
Intel Xeon Gold 6258R的标称频率是2.7GHz,最高Turbo(单核)频率为4.0GHz,不过这是在运行Non AVX指令时才能达到的;如果是AVX 2.0浮点计算会有降低;而AVX 512则会进一步降低。
如上面Intel文档,Xeon 6258R在AVX 512浮点负载下的Base基础频率是1.8GHz(也就是没有Turbo的时候),28核跑满最高Turbo频率为2.5GHz。经过对比测试,prime95(如下图)的压力负载较重,所以同样功耗下CPU频率较低一些;如果换成AIDA 64等跑AVX 512就能达到高一点的频率。另外,Windows和Linux系统等因素也会有细微影响。
我看s-tui软件自己也有Stress压力测试功能,今天先不做更多讨论了。
祝玩得愉快!大家如有什么好东西也欢迎推荐给我:)