[转帖]AMD 64核搅局工作站市场:Dell Precision 7865技术解析

amd,搅局,工作站,市场,dell,precision,技术,解析 · 浏览次数 : 0

小编点评

## AMD CPU工作站适合跑的应用、性能什么的? **今天就分享到这里了,关于AMD CPU工作站适合跑的应用、性能什么的,以后有机会再写给大家吧。** **以下是作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。** **支持以下内容:** * **Precision 7865 spec sheet** * **企业存储技术文章分类索引** * **其他相关技术文章** **扩展阅读:** * **企业存储技术**文章分类索引(微信公众号专辑) * **其他相关技术文章** **其他提醒:** * 本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。 * 您想在这个公众号上分享自己的技术干货,也欢迎联系我:)尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持! **# AMD # CPU # WORKSTATION # STORAGE # TECH # LIFE**

正文

https://zhuanlan.zhihu.com/p/568122086

 

前言:连Intel自己都承认,代号Sapphire Rapids的下一代Xeon Scalable延期到明年上半年,给AMD服务器CPU提高占有率创造了机会。如果Intel当初能预测到今天的局面,会不会在工作站上也引入第三代Xeon SP平台呢?我认为现在这个窗口,也是AMD切入主流工作站市场的一个好机会吧。

目录

- AMD Threadripper PRO 5000:EPYC3的单路工作站版本

- 硕大的6铜管底部直触CPU散热器

- 4+2+N存储盘位、整机散热风道设计

- 内存插槽:除了通道布局,还暗藏了什么?

- 从PCIe插槽和供电看显卡(GPU)支持

- NVMe存储优化设计:专用接口和温度传感器

 

接前文:《以“小”见大:从Precision 3660看工作站技术发展趋势

移动工作站DDR5内存频率之殇:怎么破?

 

AMD Threadripper PRO 5000: EPYC3的单路工作站版本

在今年聊过配置12代Core CPU的台式、移动工作站之后,一款在整体设计上让我更感兴趣的产品终于发布了——那就是AMD Ryzen Threadripper(线程撕裂者)PRO 5000WX系列。

 

 

如上图,这个针对工作站的处理器系列,从硬件结构上大致就相当于单路的第三代EPYC 7003系列服务器CPU。其最高配64核型号,也是采用8个8 Core的CPU Die(应该是台积电5nm工艺),加上中间那个尺寸较大的I/O Die(应该是14nm制程)组成的Chiplet小芯片架构。

前几年就关注我公众号的读者朋友可能看过下面2篇,对服务器CPU感兴趣的朋友也可以参考下:

AMD EPYC2服务器片上NUMA设置&应用建议

多Die封装:Chiplet小芯片的研究报告

 

 

点开后可放大查看图片,以下同

在Windows 11以及较新版本的Win10系统中,Ryzen Threadripper PRO 5995WX都能正确识别为1颗64核128线程(逻辑处理器)CPU。

与Intel 12代Core CPU建议使用Win11的调度器,才能对大、小核架构最佳支持不同的是,AMD目前都还是大核,所以不用担心Win10影响效率。

 

 

Dell Precision 7865 Tower塔式工作站

在Dell当前工作站产品线中,Precision 5820/7820共用的机箱(结构)是2017年就已发布的。我感觉7865这一代更新将至少考虑未来2-3年的需求。不说远的,NVIDIA刚发布的GeForce RTX 4090显卡(450W功耗),我曾经猜测Dell 3660工作站上的1000W电源选项就是为它准备的。

 

 

注意:上图拍照时的DIMM内存插法,并不是最优化的。请参见下文中详细说明!

AMD Ryzen Threadripper的CPU插座是与EPYC完全相同的SP3(LGA 4096),比Intel一、二代Xeon Scalable的LGA 3647引脚还要多,这也是它能支撑64核心、8通道内存控制器的重要前提。

 

 

AMD “SP3”插座CPU有特色的安装方式

 

 

Ryzen Threadripper PRO 5995WX背面照

 

 

尽管Threadripper系列CPU型号没有服务器那样丰富,只是12、16、24、32、64核心共5款。但我觉得要留意下280W TDP(热设计功耗),这能够确保它们在全核工作时还能保持较高的主频。

硕大的6铜管底部直触CPU散热器

 

 

根据上图中的比例关系,参照下内存槽就不难看出Precision 7865工作站的CPU散热器有多大个头。

 

 

我的拍照背景有点零乱,请见谅。有兴趣的朋友可以估一下这个散热器的成本大概多少:)

 

 

一共6根热导管,并且是贯穿散热器底部直接贴合到Ryzen Threadripper PRO CPU表面。这应该是为了尽量降低280W风冷散热的噪音,工作站用户普遍在乎这个。

4+2+N存储盘位、散热风道设计

 

 

打开Precision 7865机箱侧盖板之后,它上面有多少“机关”结构设计我先不在这里具体讨论,有2张示意图不容错过——Mechanical Overview和Electrical Overview,分别对应机械和电气。

 

 

先看上图中的3个红框,这是6个存储驱动器安装位(不算超薄光驱)。板载的M.2 PCIe SSD 0/1不用我解释了;Internal HDDs 2/3是内置的3.5/2.5英寸硬盘位;再往上的External Drives是可以从机箱前面板直接插拔的2个驱动器位(Flexbay),这里可以选配NVMe SSD或者SATA盘,两种接口1+1的组合也支持。

Precision 7865可以安装4个3.5英寸硬盘;NVMe SSD最多当然远不只4个,别忘了还可以加2/4个M.2的Ultra-Speed Drive转接卡(也更新为支持PCIe 4.0的新款),这取决于PCIe插槽还有多少剩余。大家还记得上次我在Dell 3660工作站上是怎么测试的吗?(扩展阅读《10GB/s存储方案设计测试:用PCIe 5.0单盘还是SSD RAID?

然后看上图中的那些箭头。其中机箱后部2个FAN Rear 0/1主要负责CPU散热,同时稍带了内部HDDs 2/3;主板中间有个小的DDR Fan应该是辅助内存散热;右下方机箱进风口的大尺寸系统风扇,主要是针对PCIe扩展卡,稍带板载M.2 NVMe SSD 0/1;顶部的Fan HDD是用于2个External Drives的。

按照Dell工作站的习惯,BIOS设置里应该支持每个区域风扇转速单独调节(加速),比如使用在特殊环境(如超海拔高度),或者加了什么被动散热的大功率板卡。应该说这还不是所有的风道。首先PSU电源也有风扇向后排气;另外如果安装涡轮风扇的显卡,对整体散热容量也会有提高助益。

 

 

Precision 7865主板上的M.2 PCIe SSD 0/1安装位,散热片下可支持2个2280或者2230 SSD。

 

 

Dell工作站前面板的Flexbay可抽换驱动器,许多朋友应该都不陌生了。在上面照片中的2个5.25英寸宽度仓位上,可以都选配成NVMe SSD、SATA盘或者1+1。如果是图中这样支持M.2的转接托架,那么后面依然会有U.2 SSD的背板,4年前我就是在Precision 5820上测试了2.5英寸的Intel Optane 900P傲腾SSD

内存插槽:除了通道布局,还暗藏了什么?

 

 

7865工作站一共8个DDR4-3200 DIMM内存插槽,AMD Ryzen Threadripper PRO CPU的内存控制器正好是8个通道,也就是说8条插满时内存带宽应该是最高的。

在《Precision 7865 塔式工作站设置和规格》里推荐的内存安装数量是1、2、4和8。经过我简单的尝试,发现要按照上图或者主板上标注的插槽顺序来安装才能实现理想的通道数。比如2条内存,要插在DIMM 1+2槽才能识别为双通道,而不建议插为左右对称的1+3或者2+4;4条内存时相对不太容易犯这个错吧。

 

 

Precision 7865最大支持8条128GB内存,在上述文档以及产品彩页中我看到的都是“ECC”,也有的地方写了RDIMM。以往Dell 7000系列工作站出厂标配应该都是RDIMM,一方面是Xeon内存控制器的要求,另外无缓冲的UDIMM最大单条容量只有32GB。

不过只是从纯技术的角度分享个信息:UDIMM内存曾经在我手头的测试机上“点亮”运行,当然Dell并不对非认证部件提供技术支持,我也不担保每一台7865都可以这样使用。特别是,不要混用RDIMM和UDIMM内存。

扩展思考:AMD的EPYC服务器CPU应该不能支持UDIMM吧?

 

 

固定在7865工作站导风罩上的DDR Fan内存风扇

从PCIe插槽和供电看显卡(GPU)支持

 

 

上图中我用红圈标注的3处,是为了指示那3个PCIe 4.0 x8插槽的末端是Open开放的,即物理结构上可以安装x16金手指的插卡。相比之下,当前Precision 5820/7820/7920工作站的PCIe插槽,无论电气上是x8、x4还是x1 lane,都使用了全长的x16 PCIe物理连接器。 7865为什么不延续之前的设计呢?

这个问题不难解释,因为曾经遇到过几次,客户自行拆装显卡时插入了电气上PCIe 3.0 x4甚至是x1的插槽——特别是后者出现性能问题不难理解吧?无论你用蓝色、黑色来标明不同的PCIe插槽,以及在x16插槽旁边印上75W供电都可能有人不看。而如今以7865工作站上PCIe 4.0 x8的带宽(与PCIe 3.0 x16相同),像RTX A4000这个级别的单宽显卡,我反倒觉得性能发挥应该没问题了。

Precision 7865从电源引出4个8pin辅助供电针对GPU,从PCIe规范来看每组至少能提供150W的稳定供电。下面我想分几种不同的显卡讨论下(只闲聊yy,不代表官方):

- NVIDIA RTX A6000或者最新发布RTX 6000 Ada(Ada Lovelace 架构),每块卡300W,应该完全支持2块。

- GeForce RTX 3080、3080Ti、3090,每块卡320-350W,如果是2.5-3插槽宽度只能安装一块。但要是用双宽涡轮风扇的版本,2卡技术上应该可行——相比于当前的Precision 5820,一方面7865的1350W电源功率提高了不少;另外,大家应该也看到2个PCIe x16插槽的间距拉大了,这样2块GPU热源不像以前那样紧挨着,有利于散热。

- 新发布的GeForce RTX 4090 450W,我感觉不会有双宽风冷散热的版型了?支持1块技术上应该ok。RTX 4080 16GB是320W,如果有厂商推出双宽、2个8pin供电接口的型号,7865工作站是不是也能支持2块?

 

 

上图是NV官网当前给出的4080 16G(左)和12G(右)规格

- 像RTX A4000这样的单宽、150W级别功耗的(也包括特定版本、单宽涡轮风扇的RTX 3060),最多能支持4-5块吗?其实我知道曾有客户在5820工作站上用过4块RTX 4000显卡,但为了严谨一些,稍后我写到电源时会讨论下PCIe插槽的供电是否足够。

 

 

在《Precision 7865 塔式工作站服务手册》里我看到上图,不经意间似乎透露了一个信息:画红框部分的显卡,如果我没看错应该是RTX 3070。既然电源足够,也就坚定了我对支持2块双宽大功率GeForce显卡的信心(只是从技术上讨论,不代表出厂配置)。

 

 

尽管Dell工作站之前也支持出厂配置部分型号的GeForce显卡,但像7865这样在公开文档中写明的可能还是第一次?关于DSC(Display Stream Compression,显示流压缩技术),当前应该只有DisplayPort 1.4a和HDMI 2.1接口才支持,限于本文篇幅先不展开讨论了。

 

 

如上表,Precision 7865配置了1350W 80Plus白金效率电源,3组+12V输出分别高达42A、36A和72A。

- 第1组12 VA供主板,包括内存、PCIe插槽,以及通过DC-DC电路转换输出给硬盘/SSD等使用。这一组的额定功率达到504W,如果有4个PCIe插槽跑满75W也才300W,实际情况能用满这个的显卡真不多。

- 第2组12 VB专供CPU(下面会在主板图中列出接口位置),432W额定输出相对于280W的AMD Ryzen Threadripper来说,考虑到主板VR损耗也有一定Turbo的裕量吧。

- 第3组12 VC专用于GPU显卡等PCIe设备的辅助供电接头,一共864W相当于4个8pin接头可以同时分配到216W(而不只是150W)。

NVMe存储优化设计:专用接口和温度传感器

 

 

上图是7865工作站的主板,数字标注在下表中都可以查看,我就不逐一解读了。标红框的部分:“21”是指出2个M.2 NVMe SSD的槽位;左上角的“3”和“4”,则是为了连线支持机箱前面板的2个NVMe SSD Flexbay。

 

 

参照图&表,Precision 7865为CPU提供了3个4pin电源接口。另外想说明一下的是THRM0和THRM1这2个热传感器连接器,它们的作用是通过温度来调节SSD/HDD Flexbay后面的风扇转速,其实在当前的Dell 5820/7820/7920工作站上也有类似设计。

 

 

上图是我拆下了位于Flexbay后面的金属支架(可以看到安装了一块NVMe SSD的背板),针对2个驱动器各有一个热传感器引线到SENSOR 0、1的位置。

 

 

最后再补充一张Precision 7865的主板实物图。

今天就分享到这里了,关于AMD CPU工作站适合跑的应用、性能什么的,以后有机会再写给大家吧。

 

参考资料

《Precision 7865 塔式工作站服务手册》

 

扩展阅读:《企业存储技术》文章分类索引(微信公众号专辑)

注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)

尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage

与[转帖]AMD 64核搅局工作站市场:Dell Precision 7865技术解析相似的内容:

[转帖]AMD 64核搅局工作站市场:Dell Precision 7865技术解析

https://zhuanlan.zhihu.com/p/568122086 前言:连Intel自己都承认,代号Sapphire Rapids的下一代Xeon Scalable延期到明年上半年,给AMD服务器CPU提高占有率创造了机会。如果Intel当初能预测到今天的局面,会不会在工作站上也引入第三

[转帖]使用GCC编译器实测兆芯KX-U6780A的SPEC CPU2006成绩

https://baijiahao.baidu.com/s?id=1722775453962904303 兆芯KX-U6780A是一款8核2.7GHz的使用x86/AMD64指令集(架构)的国产CPU,于2019年发布。兆芯于2013年成立,不久之后就使用VIA的CPU成品成功申请了“核高基”重大专

[转帖]Oracle 通过 Exadata 云基础设施 X9M 提供卓越的数据库性能和规模

https://www.modb.pro/db/397202 32个节点的RAC 服务器 每个服务器 两个 64核心的AMD CPU 四个线程干管理 252个线程进行数据库处理 252*32=8064 Exadata Cloud Infrastructure X9M 以相同的价格比上一代产品多 2.

[转帖]influxdb 2.0.3 tar.gz的安装与配置

下载地址:https://dl.influxdata.com/influxdb/releases/influxdb2-2.0.3_linux_amd64.tar.gz 安装influxdb ### 解压 [root@jyzbdb2 soft]# tar -zxf influxdb2-2.0.3_li

[转帖]Perf 笔记

https://www.cnblogs.com/jyi2ya/p/16278495.html 环境 Linux Syameimaru-Aya 5.17.0-2-amd64 #1 SMP PREEMPT Debian 5.17.6-1 (2022-05-11) x86_64 GNU/Linux。 Pe

[转帖]497.【kubernetes】使用 buildkit 构建镜像

https://www.jianshu.com/p/835179171609 一、安装 buildkit 客户端 buildkit 可执行文件: 下载地址解压:tar -zxvf buildkit-v0.10.6.linux-amd64.tar.gz复制到 /usr/bin cp build/bui

[转帖]AMD Ryzen 7000系列处理器大降价 7950X和7900X分别降至3999/3299元

https://www.expreview.com/85434.html 此前AMD公布了2022年第三季度业绩,营收为55.65亿美元,同比增长29%,相比上一个季度减少了9.85亿美元。其中客户事业部的营收为10.22亿美元,不到上个季度(21.52亿美元)的一半,同比下降40%,营业亏损了26

[转帖]AMD EPYC——CPU命名规则

AMD的三代服务器CPU都属于7000系列大锅,那么您如何知道要购买的产品呢? 只要看一下右边的最后一个数字,数字1代表第一代那不勒斯EPYC,数字2代表罗马型号,数字3代表新米兰产品。 始终从右到左,第二个数字是性能指标。 在这种情况下,它可以是1、4、6或F。这三个数字表示各种性能步骤,其中6表

[转帖]AMD Zen CPU 架构以及不同CPU性能大PK

https://plantegg.github.io/2021/08/13/AMD_Zen_CPU%E6%9E%B6%E6%9E%84/ 前言 本文先介绍AMD Zen 架构,结合前一篇文章《CPU的生产和概念》一起来看效果会更好,在CPU的生产和概念中主要是以Intel方案来介绍,CPU的生产和概

[转帖]AMD第四代宵龙 9174F 亮眼

https://www.amd.com/zh-hans/processors/epyc-9004-series#%E8%A7%84%E6%A0%BC 型号规格 型号CPU 核心数量线程数量最大加速时钟频率全核心加速频率基准时钟频率三级缓存默认热设计功耗/TDP AMD EPYC™ 9654P 96