[转帖]AWS Graviton 3:遵循摩尔定律又有自己节奏(修订版)

aws,graviton,遵循,摩尔定律,自己,节奏,修订版 · 浏览次数 : 0

小编点评

## Amazon Graviton 3 设计与创新 **主要内容:** 1. Graviton 3 是 Amazon 在 2018 年发布的第三代服务器芯片,比 Graviton 2 翻倍,性能有了显著提升。 2. Graviton 3 支持了 bfloat16 协议,提升了 3 倍的机器学习性能。 3. Graviton 3 支持了 Arm 指南指令,提升了性能。 4. 该芯片能与 Arm 服务器生态中的其他型号一起使用。 5. Graviton 3 是 SAP Hana 数据库的标杆产品,验证了 ARM 服务器生态的扩展性。 6. Graviton 3 的设计展示了创新和智能的优势,是推动数据中心性能提升的重要里程碑。

正文

https://aijishu.com/a/1060000000285160

 

 

1、Graviton 3的设计与创新

亚马逊云科技在2018年re:Invent大会发布了Graviton1,2019年发布Graviton2,因此几乎从去年开始,媒体和业界人士就预测今年要发Graviton3了。果然第一天CEO keynote 就公布了Graviton 3,550亿晶体,比300亿晶体管等Graviton2 翻倍,去年Graviton2就已经作为半导体行业的优秀产品上了摩尔定律的追踪图,Graviton3这个表现也一定可以入选的。

image.png
 
不仅仅是晶体管数目,如下图,从2018年的Graviton第一代,到今年的Graviton 3,可以清楚的看到,一代一次显著性能的飞跃。

(红色字段为作者推测,非官方信息)

image.png

单看芯片本身,无论是用Chiplet设计(当然计算die和IO die分离的7个die设计还是很创新的), 还是采用DDR5,PCIe G5,TSMC N5工艺,先进归先进,但是阿里平头哥10月发布的的倚天710也都有,随后的Intel Sapphire Rapids,AMD Genoa也都有,因此算是常规操作。不过Graviton 3的功耗,是显著低于前面说到的几个芯片的。以前,我一直没有想明白这个参数设计,直到看到Amazon C7g的服务器开盖图。这是在一个机箱内放了3个Graviton 3,成为一个3节点的高密度服务器。换句话说,一个机箱内放入3个64核的服务器节点,如果换算成常规2路CPU,则相当于每个CPU是96核。这非常符合亚马逊云科技的本色,他们追求的是相同总功耗下的整服务器/整机架的性能最大提升,这是从芯片设计阶段就通盘考虑过从处理器,到服务器节点到机架整体的合理功耗预算的分配而才能确定的联合设计方案。

最后一定要补上一句, 亚马逊云科技能做这样设计3节点服务器设计的另一个关键因素是他们有能够支持多服务节点的Nitro卡,否则每个节点都需配独立网卡,会部分抵消高密度服务器设计的优势。

image.png

2、CPU做机器学习

Amazon Graviton 3的设计中,还有一个重点要画一下。它支持了bfloat16,并且提升了3倍的机器学习性能。Intel的cooper lake , AMD的Genoa,IBM Power10也都支持了bfloat16,而且都3倍,甚至20倍的提升了机器学习的性能。CPU阵营难得一见的齐心合力,打算增强自己的人工智能业务能力。

image.png

3、与Graviton3同步的EC2 C7g实例标志着arm服务器生态成熟

除了Graviton3 在芯片,服务器上的各种创新之外,还有一点和2019年Graviton2的发布不一样。与Graviton3同时发布的还有一个实例Amazon EC2 C7g,虽然还是预览版,但是相对于Graviton2发布3个月之后,才发布实例,Amazon Graviton家族的实例研发节奏明显快了。相对于同行的仅仅芯片,尚无实例上线时间的新闻发布,Graviton3不仅仅有芯片,有服务器,还有实例预览,甚至还有客户的背书,产品成熟度有明显优势。

Amazon EC2 C7g是一个定位于高性能工作负载的实例, C就是计算优化型的标志,g就是Graviton处理器的意思。亚马逊云科技推荐的应用,包括高性能计算、批处理、电子设计自动化(EDA)、媒体编码、科学建模和基于CPU的机器学习推理。这跟当年Graviton1 支持的是 Web 服务器、容器化微服务、数据/日志处理和其他可以在更小的内核上运行轻量级工作负载,不可同日而语了。

其实Amazon Graviton2 处理器及已经在性能和功能上都实现了巨大的飞跃,成为ARM阵营的领头羊。它们为 Amazon EC2 通用型(M6g、M6gd、T4g)、计算优化型(C6g、C6gd、C6gn)和内存优化型(R6g、R6gd、X2gd)实例提供支持,工作负载类型相当广泛。打开Amazon EC2浏览可购的实例类型(https://aws.amazon.com/cn/ec2/instance-types/?nc1=h_ls),带g的实例都排在前面,感觉是主推型号。本次大会上,还新发布的Amazon G5g,这是一个Graviton + NVIDIA T4G的组合,还有两个配合最新的Nitro SSD的存储优化实例Im4gn and Is4gen,至此EC2的全产品系列都有“g”实例了。

不仅仅是生态成熟,实例丰富。Graviton3再次提升了实际应用性能。在亚马逊云科技展示的F1应用测试中,Graviton3比Graviton2 快40%。对于Nginx,Graviton3有超60%的性能提升,其它应用,也至少有25%的性能提升。

image.png
image.png
4、SAP Hana支持Graviton家族,是ARM服务器生态的重要里程碑

其实从2011年 arm开始进入服务器市场的第一天,整个业界对于arm是否能搬迁服务器生态持怀疑态度。从三大Linux逐个宣布arm版本的GA release,到Java Open JDK,gcc/LLVM, 到Ngnix, MySQL,Redis,arm十年多的时间内,获得了开源软件阵营的全力支持。

在本次大会上,亚马逊云科技宣布数据库的标杆产品SAP Hana也支持Graviton家族了。像SAP Hana这样的ISV(independent software vendors) 的支持,是Graviton家族开拓arm服务器生态的重要里程碑事件。这不仅仅是Graviton家族的成功,更是ARM服务器生态的一大步。

image.png

结尾

今天回头看,当年3.5亿美金收购Annapurna lab真是回报超高。先是领先业界一步的Nitro系列,接着是Graviton arm CPU家族,再接着是机器学习两件套支持推理的inferentia和支持训练的Trainium。数据中心的三大芯片,DPU,CPU,AIxPU,整整齐齐。

亚马逊云科技的CEO在采访中谈到芯片创新的时候说,这是改变游戏规则的能力。Graviton产品家族验证了从借助arm CPU IP的敏捷芯片设计,到芯片和服务器联合设计获取最大的TCO回报,到快速部署上云的互联网速度,这是一个用创新推动高质量服务的时代。

作者:Winnie shao
原文:企业存储技术

与[转帖]AWS Graviton 3:遵循摩尔定律又有自己节奏(修订版)相似的内容:

[转帖]AWS Graviton 3:遵循摩尔定律又有自己节奏(修订版)

https://aijishu.com/a/1060000000285160 1、Graviton 3的设计与创新 亚马逊云科技在2018年re:Invent大会发布了Graviton1,2019年发布Graviton2,因此几乎从去年开始,媒体和业界人士就预测今年要发Graviton3了。果然第一

[转帖]AWS推出arm架构的Serverless计算服务,提升34%的性价比

https://aijishu.com/a/1060000000256420 本文来自一位专家朋友Winnie shao的原创大作,希望大家喜欢。 Serverless计算服务,按狭义的说法,又被称为功能即服务,是云计算的一种模型。云服务提供商提供一个微型的架构,终端客户不需要部署、配置或管理服务器

[转帖]AWS TUNES UP COMPUTE AND NETWORK FOR HPC

https://www.nextplatform.com/2022/12/02/aws-tunes-up-compute-and-network-for-hpc/ When it comes to hardware, there was not a lot of big news coming ou

[转帖]云数据库是杀猪盘么,去掉中间商赚差价,aws数据库性能提升 10 倍!价格便宜十倍。

https://tidb.net/blog/021059f1 于是乎dba中的冯大嘴喊出了云数据库就是杀猪盘。让每个公司自建数据库。 那么有没有一种数据库又便宜又好用呢。有 哪就是tidb数据库。 之前一个dba工程师的工作内容可能包括以下几个方面: 监控带宽、流量、并发、业务接口等关键资源及访问信

[转帖]如何在 60秒内优化提升 Linux 性能?只有 2% 的人知道,还不快来学习~

https://bbs.huaweicloud.com/blogs/379243 【摘要】 如何在 60秒内优化提升 Linux 性能?只有 2% 的人知道 当你发现 Linux 服务器上的系统性能问题,在最开始的 1 分钟时间里,你会查看哪些系统指标呢? Netflix 在 AWS 上有着大规模的

[转帖]Netflix 如何在 7 分钟内完成故障转移

https://www.oschina.net/translate/how-netflix-does-failovers-7-minutes-flat?print 在冬季2012年,Netflix公司遭受了 长时间断电 持续了七个小时,由于在美东地区的AWS弹性负载均衡服务的问题。(Netflix的

[转帖]s3fs把 s3-like 对象存储挂载到本地

https://www.cnblogs.com/hiyang/p/12631908.html s3fs-fuse 是一个采用 c++🚀 开发的开源应用,它的作用是可以将 AWS S3 以及兼容 S3 API 的第三方对象存储像普通文件系统一样挂载到本地计算机,由于这种功能通过 FUSE 实现,因此

[转帖]s3对象存储挂载到本地文件夹

https://www.zhangzhuo.ltd/articles/2021/10/22/1634888049032.html 一、s3fs工具 s3fs-fuse 是一个采用 c++ 开发的开源应用,它的作用是可以将 AWS S3 以及兼容 S3 API 的第三方对象存储像普通文件系统一样挂载到

[转帖]s3fs把 s3-like 对象存储挂载到本地

s3fs把 s3-like 对象存储挂载到本地 s3fs把 s3-like 对象存储挂载到本地 s3fs-fuse 是一个采用 c++🚀 开发的开源应用,它的作用是可以将 AWS S3 以及兼容 S3 API 的第三方对象存储像普通文件系统一样挂载到本地计算机,由于这种功能通过 FUSE 实现,因

[转帖]实测:云RDS MySQL性能是自建的1.6倍

https://www.cnblogs.com/zhoujinyi/p/16392223.html 1. 摘要 基于之前写的「云厂商 RDS MySQL 怎么选」的文章,为了进一步了解各云厂商在RDS MySQL数据库性能上的差异,本文将对自建MySQL、阿里云、腾讯云、华为云和AWS 的 RDS