[转帖]看图识至强:10nm、40核、液冷、云优化…

看图,10nm,液冷,优化 · 浏览次数 : 0

小编点评

**Ice Lake-SP核芯结构对比:** | 参数 | XCC (7×8) | Skylake-SP/Cascade Lake-SP | |---|---|---| | 核心数 | 12 | 18 | | 2D Mesh 网格规模 | 7×8 | 4×4 | | I/O单元分布 | 1/2 (边缘) | 1/3 (矩阵中心) | | L1 和 L2 cache | 更大 | 更小 | | IPC 性能 | 20% | 15% | | 核芯排列方式 | XCC | HCC | | 核心数量 | 40 | 32、40、64、80 |

正文

https://zhuanlan.zhihu.com/p/375686108

 

2021年4月,英特尔(Intel)正式推出代号Ice Lake-SP的双路处理器,与2020年6月中旬发布、代号Cooper Lake-SP的四至八路处理器,共同构成第三代至强可扩展处理器(3rd Gen Intel Xeon Scalable processor)家族。

 

 

与前两代相比,第三代至强可扩展处理器最主要的任务,就是增加服务器的CPU核芯数,并直接从最少8核芯的银牌系列起步,去掉了核芯数最少的铜牌系列。

 


注意中间有字母的小色块,第三代至强可扩展处理器家族已经没了铜牌(Bronze)系列

但是,4~8路的Cooper Lake-SP,和1~2路的Ice Lake-SP,增加核数的方式,全然不同——因为它们本来就不是一回事儿,从制程到架构都不一样。

四八路,14nm老路

Cooper Lake-SP与前代Cascade Lake-SP一样采用14纳米制程、最多28核芯56线程,旨在以四路替代双路,用更多的CPU提供更多的核芯。

 


四路替代双路,提供同样核心所用的服务器和网络设备等都减少,意味着需要管理的设备变少,机柜成本也下降

这种思路可以看作是第二代至强可扩展处理器家族中Platinum 9200系列的延续。代号Cascade Lake-AP的至强Platinum 9200系列,采用把2个28核die封装在一起的MCM(MultiChip Module,多芯片模块)方式,将单个CPU的核芯数量增加到56个。所以,2个Platinum 9200系列处理器组成的双CPU系统,本质上还是用UPI(Ultra Path Interconnect)互连起来的四路平台,只不过两两封装为一体(胶水)而已。

 

 

把2个全核die封装在一起的一大弊端,就是CPU的热设计功耗(Thermal Design Power,TDP)飙升到350~400W,对服务器的散热设计提出了更高的要求,1U的紧凑型平台,基本要标配(冷板式)液冷了。

在第二代至强可扩展处理器推出的2019年,英特尔已经在推动2U四路服务器设计。继而,在2020年推出四路起步的Cooper Lake-SP,在10nm制程到位前,先以四路堆积更多的核数,抵御竞争对手双路系统的攻势。

 


采用散热器高低、纵横搭配(低的为T型,将CPU发出的热量通过热管导出到横向的远程散热片,增大散热面积)来解决四路CPU散热问题的2U服务器。基于这一类2U四路服务器产品,阿里云等服务商在2020年推出了基于Cooper Lake-SP的新一代云计算实例

4个CPU要(在整体性上)抗衡2个CPU,就需要强化CPU之间的通信,所以每处理器的UPI数量,从Cascade Lake-SP(CLX)的3个,倍增至Cooper Lake-SP(CPX)的6个,四路系统中任意2个CPU之间都有2条UPI直连。PCIe的规格和数量不变,内存也仍然是(每CPU)6通道,只有规格“与时俱进”,提升到DDR4 3200。

 

 

单双路,10nm新核

Ice Lake-SP(ICX)终于用上了10纳米制程,单个CPU(die)的核芯数量从28个增至40个,相应的,I/O能力也有不同程度的增长:

  • UPI数量还是2或3个,但速率从10.4GT/s上升到11.2GT/s;
  • 内存升级为8通道,DDR4 3200;
  • PCIe规格从3.0升为4.0,数量也从48个增加为64个。

 

 

核芯、内存通道、PCIe等数量的增加,都要从至强可扩展处理器的2D Mesh架构说起。

前两代至强可扩展处理器(Skylake-SP和Cascade Lake-SP),都是6×6的2D Mesh,UPI和PCIe等互连单元占去一条边上的6个,再减去网格另外两条边上的各一个3通道内存控制器,剩下正好是28个(36 - 6 - 2)核芯。

 


每CPU两侧各8个DIMM插槽(双路就是两个CPU之间16个)是Ice Lake-SP平台相比前代的主要外观特征

要增加CPU的核心数,就要扩大2D Mesh的网格规模。Ice Lake-SP增加了1行2列,变成7×8的网格架构。

2D Mesh架构有两大特点:

  1. 所有I/O单元(UPI、PCIe、内存控制器等)都布置在矩阵的边上;
  2. 核芯访问共享Cache(LLC)和I/O(特别是内存)的时延,随矩阵规模的扩张而增长。

 


Skylake的6×6矩阵(XCC)

所以,如果核芯数量不是很多,矩阵的规模小一些会比较好。譬如第一代至强可扩展处理器(Skylake-SP),就有XCC(eXtreme Core Count,最多核or极多核)、HCC(High CC,高内核数)和LCC(Low CC,低内核数)之分:

  • XCC是完全体6×6矩阵,可支持到28个核芯;
  • HCC是6×4矩阵,可支持到18个核芯;
  • LCC是4×4矩阵,可支持到10个核芯。

 

 

Ice Lake-SP也有XCC和HCC之分,我还没看到HCC的架构(也许就是之前的6×6?),但XCC应该是7×8无疑。下面就以两个XCC的完全体简单对比一下。

Skylake-SP/Cascade Lake-SP的I/O单元都集中在矩阵的一半(里的边缘位置),另一半(6×3)的18个全都是核芯,离内存控制器仍不算远,因为矩阵的规模不大。

 


Ice Lake-SP采用Sunny Cove微架构,新的核芯功能更强大,L1和L2 Cache容量也更大,IPC性能据称有20%的提升

Ice Lake-SP则把矩阵的4条边都用上,一方面是可以容纳增加的I/O单元(如内存控制器),一方面让I/O单元(如PCIe和UPI)的分布更为均匀。Skylake-SP/Cascade Lake-SP有一条边完全不布置CPU核芯的做法得以延续,哪怕是放上了3个占位的Dummy,而不是用来把核芯数量扩展到43个——或许42个更为合适,因为紧邻UPI单元的那个(Dummy位)离内存控制器过于遥远。

 


6×6 → 7×8,红框内可理解为增加的12个核心

如果把这3个Dummy位换成核芯,会拖累整个CPU的平均内存访问时延,拉开与Cascade Lake-SP的差距。现在已经有40个核芯了,再增加2~3个的意义,不是很大。

可以简单的认为,与Skylake-SP/Cascade Lake-SP相比,Ice Lake-SP净增了两列6个核心(6×2),也就是40与28的差值。

 

 

既然顶着“第三代至强可扩展处理器”名头的是两种差异很大的产品,那么,从型号上怎么区分Ice Lake-SP和Cooper Lake-SP呢?

第三代至强可扩展CPU全览

至强可扩展处理器的命名规则并没有变,它只是“扩展”了:在4位数字后面的字母后缀,如果有H,就代表适用四路和八路平台的Cooper Lake-SP,目前共有10余款,分属铂金和金牌系列,包括一些后缀为HL的机型。

 

 

L代表每插槽可以支持4.5TB内存的大内存型Cooper Lake-SP,而Ice Lake-SP每插槽可以支持多达6TB内存——当然,这些都需要傲腾持久内存的配合。

 

 

然后是为不同应用场景优化的Ice Lake-SP产品。

先看不带后缀的,包括4款铂金系列,核心数量从32到40不等,L3 Cache最大60MB,热设计功耗在250~270瓦(W)之间。

 

 

8款金牌6系列和2款金牌5系列,其中有高基频、核数少的6334,也有频率较低而核数多的6338和6330。

 

 

傲腾持久内存PMem 200系列在第三代至强可扩展处理器家族得到了广泛支持,银牌系列除外——只有1款支持。

 

 

Y后缀代表支持Intel Speed Select Technology - Performance Profile 2.0 (Intel SST-PP) ,可以理解为一种更全面的变频技术。

 

 

N后缀代表为网络和NFV应用优化,核数较多,频率变化灵活,其中5318N还兼具Y后缀的特性。

 

 

T后缀代表长生命周期(10年)和NEBS热设计友好,Tcase温度高,适合电信行业应用。

 

 

还有两款为云计算的虚拟机应用优化,都具有较多的核数。其中:

  • P后缀代表为IaaS优化,为虚拟机提供更高的频率;
  • V后缀代表为SaaS优化,针对高密度、低功耗虚拟机环境提高编排效率。

 

 

8352V还兼具Y后缀的特性。

14nm的Cooper Lake-SP最大TDP已经达到250W,10nm的Ice Lake-SP在大幅增加核芯数量之后来到了270W,下一代就奔着350W去了,液冷越来越接近必选项。

 

 

Q后缀即代表为液冷环境优化,与核数、Cache容量和TDP相同的8368相比,8368Q的运行频率要高100~300MHz,初步体现了液冷加持的效果。

 

 

S后缀代表为SGX(Software Guard Extensions)提供最大的“飞地”(enclave)存储空间,单CPU可达512GB,双路系统就是1TB,不带S后缀的8380、8368和8368Q也在此列。

 

 

M后缀代表为AI处理和媒体工作负载优化,8352M运行频率不算高,在32核产品中是TDP最低的一档。

 

 

U后缀代表单路型,8351N也属于这类产品。

与[转帖]看图识至强:10nm、40核、液冷、云优化…相似的内容:

[转帖]看图识至强:10nm、40核、液冷、云优化…

https://zhuanlan.zhihu.com/p/375686108 2021年4月,英特尔(Intel)正式推出代号Ice Lake-SP的双路处理器,与2020年6月中旬发布、代号Cooper Lake-SP的四至八路处理器,共同构成第三代至强可扩展处理器(3rd Gen Intel X

[转帖]一张图看懂 SQL 的各种 join 用法

https://cloud.tencent.com/developer/article/1954012?areaSource=104001.79&traceId=7WZNP412yK3vh7ebw4th0 发布于2022-03-10 13:54:43阅读 870 下图展示了 LEFT JOIN、RI

[转帖]Java FlameGraph 火焰图

http://www.wjhsh.net/xingzifei-p-7446264.html 上周一个偶然的机会听同事提到了Java FlameGraph,刚实验了一下,效果非常好。 一、什么是FlameGraph 直接看图说话。FlameGraph 是 SVG格式,矢量图,可以随意扩大缩小,看不清的

[转帖]电脑硬件入门——基础之计算机架构

https://zhuanlan.zhihu.com/p/63322067 谈电脑硬件的文章很多,但一般是从电脑有哪些配件说起。这篇文章我尝试从架构方面来阐述,希望更有助于萌新对电脑的各种配件的作用进行理解吧。 1、冯·诺依曼架构[1] 现代计算机,常见的有两种架构,其中一种是冯·诺依曼架构。先看图

[转帖]陈巍谈芯:一图看懂芯片禁令的目的、范围和影响

https://zhuanlan.zhihu.com/p/572905835 陈巍谈芯:让你一图看懂某国芯片禁令的目的、范围和影响。 感觉这回是“芯片战争”,影响全球半导体产业链。但也是有方法减少影响的。

[转帖]线上大量CLOSE_WAIT的原因深入分析

这一次重启真的无法解决问题了:一次 MySQL 主动关闭,导致服务出现大量 CLOSE_WAIT 的全流程排查过程。 近日遇到一个线上服务 socket 资源被不断打满的情况。通过各种工具分析线上问题,定位到问题代码。这里对该问题发现、修复过程进行一下复盘总结。 先看两张图。一张图是服务正常时监控到

[转帖]关于TIME_WAIT优化

我们先看一下四次挥手过程 # netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' # netstat -tan | awk '{print $6}' | sort | uniq -c 通过此图先说明几个概念: TI

[转帖]水晶头超5类和6类的区别是什么?六类水晶头和超五类水晶头通用吗?

一图胜千言,5类水晶头和6类水晶头从外观上看并没有很大的区别,但实际上里面还是有很大的不同。 5类水晶头的8根线芯是一字排开的,而6类水晶头的8根线芯是呈现上、下交错的形式排列。 原因其实特别简单,标准的超五类网线线径是0.51mm,六类网线的线径是0.57mm,超六类网线的线径是0.58mm。 那

[转帖]Nginx(2):架构设计与工作流程

https://cloud.tencent.com/developer/article/1886166?areaSource=&traceId= 这些天呐,实在是给我看晕了。起因自然还是对 nginx 不是很了解哈。那我是来看什么的?一开始就从细节出发,有点管中窥豹,不得全貌了。 图来自网络 架构设

[转帖]看了阿里云云解析DNS,涨见识了

https://www.jianshu.com/p/8354e647cf71 在学习这篇文章前,只知道DNS就是做域名解析的,查到域名对应的ip就结束了。没成想惊呆了,DNS还有这么大的规模这么低的时延要求。 阿里云DNS是一个复杂的巨型分布式系统。依托云计算丰富的计算和存储资源和技术,阿里云在全球