[转帖]AMD处理器ZEN一代之国产化海光

amd,处理器,zen,一代,国产化,海光 · 浏览次数 : 0

小编点评

## Summary of the text: This text provides an overview of the Hygon Dhyana CPU, an x86 processor manufactured by Chinese company Hygon. **Key points:** * The Hygon Dhyana is a 32-core processor with a unique security feature called SM2, which replaces AMD's SEV for enhanced security. * It can achieve high performance with AVX and AVX2 instructions enabled, but these features are disabled by default. * The floating-point performance is significantly lower compared to other CPUs due to lost precision. * The SM2 instruction is a new security feature that significantly improves performance. * The Hygon Dhyana is not compatible with older kernels like 4.10, which limits its potential. * The performance is comparable to other CPUs from AMD with similar specifications but without AVX and AVX2 support. * The Hygon Dhyana is a custom CPU designed for Chinese servers and has some limitations due to cooperation agreements. **Overall, the text highlights the strengths and limitations of the Hygon Dhyana CPU for use in Chinese servers.**

正文

https://huataihuang.gitbook.io/cloud-atlas-draft/os/linux/kernel/cpu/amd_hygon

 

 
2020年国产化处理器受到了广泛的关注(中美贸易战),中科海光(Hygon)是国内维二具备生产X86处理器的中国公司,其产品具有一定代表性:
  •  
    2016年中科海光(国天津海光先进技术投资有限公司(THATIC))向AMD购买了x86 和 SoC IP 技术授权
美国政府为英特尔、AMD 等公司生产的处理器进行了价值标定,一旦其算力(FLOPS)和功耗的比值过高就会被认为是「性能过强」而被限制出口。
2015 年,AMD 就已向美国国防部、商务部等机构进行了申请,并获得了向中国提供技术转让的许可。
2019 年,美国商务部将海光加入了实体清单,这意味着 AMD 难以继续向合资企业授予任何其他 IP 许可。
目前海光能够使用的是2016年已经获得的原始IP(AMD 14nm Zen架构),而不是完整的技术转让(加密技术相关技术被阉割,浮点性能削弱),底层设计和技术、专利依然属于AMD,海光只能在高级层面根据自己的需要进行修改、定制。
Hygon服务器CPU
Hygon服务器CPU是32核处理器,现代处理器都支持超线程,通过超线程技术(x2),相当于 64 HT 处理器。在服务器上采用双处理器SMP系统,则可以在服务器上通过 cat /proc/cpuinfo 看到 128 HT (32x2x2)。
  •  
    CPU缓存
     
  •  
    L1缓存
     
  •  
    64KB四路 L1指令缓存
  •  
    32KB八路 L1数据缓存
  •  
    L2缓存
     
  •  
    512KB八路 L2缓存
  •  
    L3缓存
     
  •  
    8MB十六路 L3缓存
  •  
    加密
     
  •  
    海光CPU 被去除 了 AMD原始的Zen一代处理器使用AMD虚拟化功能(SEV)的安全加密:RSA, ECDSA, ECDH, SHA 和 AES
  •  
    海光Dhyana处理器SEV被改成使用 SM2, SM3 和 SM4 算法(国密算法)
  •  
    SM2是椭圆曲线公钥密码算法,相比于RSA更先进、更节能、更安全,国家密码管理局2010年12月17日发布。
  •  
    SM3是哈希算法,属于密码散列函数标准,用于数字签名及验证、消息认证码生成及验证、随机数生成等,原理、安全性和效率都类似SHA-256,国家密码管理局2010年12月17日发布。
  •  
    SM4是分组密码算法,用于数据加密,分组和秘钥长度都是128位,类似AES-128,国家密码管理局2012年3月21日发布。
  •  
    海光获得架构的整数性能基本没变,但是浮点性能损失很大:
     
  •  
    DIV、SQRT等浮点指令直接消失
  •  
    大量的MMX/SSE简单指令则被降速
随机数生成器
早期海光CPU版本 /dev/urandom 性能较低,原因是RDSEED(用于生成随机数算法的种子生成)真随机数发生器产生种子速度不够强或质量还不足,小概率被撞上了产生了延迟。后期二代产品真随机数发生器由1个增加到3个,同时被撞上的概率接近0,就不存在这样的问题了。
参见 中科海光CPU的首次评测:基于AMD架构,覆盖桌面服务器端 提到了Hygon Dhyana(桌面版本) RDSEED 比 Hygon Dhyna Plus(服务器版本)要慢10倍。
不过海光RDRAND算法比原先AMD Zen版本快
测试服务器 /dev/urandam 设备性能:
 
head -c 1M /dev/urandom > /tmp/out
如果出现比较明显的延迟,则可能和上述 RDSEED 性能相关,有一定概率会导致操作系统加密相关应用异常(例如sshd服务)。可以考虑在BIOS设置 CBS-Moksha Common Options > RDSEED and RDRAND Control 配置成 disable (默认是 auto) ,这样操作系统会调用软随机数发生器来规避这个问题。
功能缺失
中科海光CPU的首次评测:基于AMD架构,覆盖桌面服务器端 说明,虽然海光CPU标记了 AVX 和 AVX2 功能,但实际被禁用,导致相关测试无法通过。此外 AESNI、SHA、CLMUL、FMA4、BMI、BMI2等指令也无法运行。
上述指令和加密编码相关,导致海光CPU(32核心双处理器配置)的AES编码甚至不如入门级4核心锐龙3 1200
性能结论
  •  
    海光CPU在AMD Zen 1基础上做了大量修改,例如加密功能做了替换。但是整体性能比同代原版CPU略差:
     
  •  
    整数性能基本相同,浮点性能显著下降(普通指令吞吐量只有原先1/2)
  •  
    随机数生成机制已经修改,加密引擎被替换
  •  
    不能对常见对AES指令加速(不支持AVX和AVX2功能),但是增加了国蜜要求指令 SM2, SM3 和SM$
  •  
    海光CPU基于AMD Zen1定制,由于合作协议只限于Zen 1而不是大获成功的Zen 2,所以技术上有诸多不足:例如Zen 2支持L3缓存PQoS(对标Intel RDT技术)就无法获得,这在数据中性混布计算中有非常大的局限性
  •  
    Linux从 Kernel 4.10才开始支持Zen架构,所以要能够正常工作,一定要选择 Kernel 4.10 以后版本,建议参考主流发行版本 CentOS 8以及 Ubuntu 20.04 LTS内核版本
参考

与[转帖]AMD处理器ZEN一代之国产化海光相似的内容:

[转帖]AMD处理器ZEN一代之国产化海光

https://huataihuang.gitbook.io/cloud-atlas-draft/os/linux/kernel/cpu/amd_hygon 2020年国产化处理器受到了广泛的关注(中美贸易战),中科海光(Hygon)是国内维二具备生产X86处理器的中国公司,其产品具有一定代表性:

[转帖]CPU的IPC性能是什么意思?通俗易懂科普处理器IPC性能含义

http://www.lotpc.com/yjzs/8463.html 锐龙三代处理器发布之后,AMD称基于全新的Zen2架构相比上一代Zen+,实现了高达15%的IPC性能提升,不过对于IPC性能,相信不少用户还不知道什么意思,那么CPU的IPC性能是什么意思?下面装机之家来通俗易懂科普处理器IP

[转帖]一起来体验96核心、192线程CPU——第四代AMD EPYC处理器独家测试

http://k.sina.com.cn/article_1882475282_70344b12027010s1x.html 与第三代EPYC 7003系列处理器相比,新一代EPYC 9004系列处理器有大量的技术进步,主要包括核心数量、计算线程数大幅提升到最高96核心、192线程;5nm“Zen

[转帖]Zen4架构+5nm制程+96核心 第四代AMD EPYC处理器强势来袭

https://new.qq.com/rain/a/20221111A098QE00 不得不承认,技术的持续突破和迭代,使得AMD处理器在近年来得到了“喷气机式”的增长,无论是产品性能,还是产品的功耗,又或者说是产品的方方面面,AMD处理器都做到了空前的高度。而且,沿袭对创新和品质的追求,在“Zen

[转帖]AMD Ryzen 7000系列处理器大降价 7950X和7900X分别降至3999/3299元

https://www.expreview.com/85434.html 此前AMD公布了2022年第三季度业绩,营收为55.65亿美元,同比增长29%,相比上一个季度减少了9.85亿美元。其中客户事业部的营收为10.22亿美元,不到上个季度(21.52亿美元)的一半,同比下降40%,营业亏损了26

[转帖]从多核到众核处理器

其实“多核”这个词已经流行很多年了,世界上第一款商用的非嵌入式多核处理器是2002年IBM推出的POWER4。当然,多核这个词汇的流行主要归功与AMD和Intel的广告,Intel与AMD的真假四核之争,以及如今的电脑芯片市场上全是多核处理器的事实。接下来,学术界的研究人员开始讨论未来成百上千核的处

[转帖]【KVM】KVM和QEMU的关系及区别

KVM架构 KVM(Kernel-based Virtual Machine)包含一个为处理器提供底层虚拟化、可加载的核心 模块kvm.ko(kvm-intel.ko或kvm-amd.ko),使用QEMU(QEMU-KVM)作为虚拟机上层 控制工具。KVM无需改变Linux或Windows系统就能运

[转帖]从v8到v9,Arm服务器发展之路

https://zhuanlan.zhihu.com/p/615344155 01 ARM:3A大作 将 CPU 的设计与制造相分离的代工模式,给 AMD 提供了高度的灵活性。第二、三代 EPYC 处理器可以相对自由的选择不同的制程来匹配芯片设计的具体需求,客观上起到了帮助 AMD“以小博大”,从英

[转帖]350W+ CPU、700W+ GPU功耗:冷板和浸没式液冷哪个更有前途?

https://aijishu.com/a/1060000000363530 液冷技术方面我算不上专业,因为最近在一篇博客中看到不错的资料,这里分享给大家顺便做点讨论。 大家应该知道,Intel代号Sapphire Rapids的下一代Xeon处理器最高TDP将达到350W,AMD EPYC4功耗也

[转帖]Oracle 通过 Exadata 云基础设施 X9M 提供卓越的数据库性能和规模

https://www.modb.pro/db/397202 32个节点的RAC 服务器 每个服务器 两个 64核心的AMD CPU 四个线程干管理 252个线程进行数据库处理 252*32=8064 Exadata Cloud Infrastructure X9M 以相同的价格比上一代产品多 2.