飞腾与鲲鹏性能差异的一些思考

飞腾,鲲鹏,性能,差异,一些,思考 · 浏览次数 : 489

小编点评

**飞腾与鲲鹏性能差异的原因:** * **制程差异:**飞腾使用的是 16nm 芯片工艺,而鲲鹏使用的是 7nm 芯片工艺。制程更先进会导致性能提升。 * **指令集差异:**飞腾使用的是 ARMv8.0 架构,而鲲鹏使用的是 ARMv8.2 架构。指令集差异会导致性能略有不同。 * **架构设计:**飞腾的架构可能比 鲲鹏 的架构更繁琐,导致性能略低。 * **内存性能:**飞腾的内存性能可能比 鲲鹏 的内存性能更差。 * **硬盘性能:**华为使用的是国际知名 RAID 卡供应商,而 鲲鹏 使用的是中国本土的 RAID 卡。 * **硬件兼容性:**飞腾的硬件兼容性可能比 鲲鹏 的硬件兼容性更差。 * **应用层性能:**华为的应用层产品,如毕昇JDK,对性能有要求,这可能会导致飞腾的性能略低。

正文

飞腾与鲲鹏性能差异的一些思考


背景

自己在进行stress-ng以及sysbench的测试验证时发现:
飞腾的性能要比鲲鹏的性能有非常大的差距.
最近同事在现场也进行了压测, 也发现飞腾的性能不是特别好.
这里想简单总结一下自己学习过的资料,尝试分析一下为何差异这么大. 

制程

注意 制程采用台积电发布的时间进行对比.主要是对比代数和年代差异
飞腾使用的应该是 16nm制程工艺. 
该工艺的大量上市的时间应该是2015年. 
鲲鹏使用的应该是 7nm的职称工艺
该工艺的大量上市的时间应该是2018年.
中间至少有一代10nm以及一些改良制程. 
换句话说, 鲲鹏的制造工艺至少比飞腾要领先三年. 

但是需要说明一点的是 阿里的倚天710 使用的是 5nm的工艺. 
5nm工艺大概是2021年左右大量上市. 所以 倚天的制造工艺应该国产CPU里面最先进的
也是核心数最多的, 单芯片封装 128个 Core
飞腾和鲲鹏都是封装了 64个核心. 

通过制程上面的对比会发现 鲲鹏领先与飞腾,并且按照没代能够提升15%左右的性能的话, 其实是很可观的
也是因为制程升级不够快,才导致intel的CPU性能被AMD赶超

主频

鲲鹏的CPU主频一般是 2.6Ghz
飞腾的CPU的主频一般是 2.1Ghz
这一块差异高达 20%+ 直接导致性能差异会很大
单核能力的RT以及TPS都会有至少20%甚至更高的差异. 
基本相同的架构上面比拼的其实更多的都是频率的能力. 

架构

说明一下同频性能一般考虑的是相同架构的服务器.
如果不同架构的服务器是无法比较同频性能的. 

虽然鲲鹏和飞腾都是ARM架构的CPU
但是通过一些简单的查看会发现.
飞腾的CPU的指令集如下:
fp asimd evtstrm aes pmull sha1 sha2 crc32 cpuid
但是鲲鹏的指令集就会多一些:
fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp cpuid asimdrdm jscvt fcma dcpop asimddp asimdfhm

简单查询就会发现
飞腾应该是使用的ARMv8.0的架构,也就是第一代64位的ARMv8架构
但是对应的鲲鹏的却至少是 ARMv8.2的架构
换句话说说, 鲲鹏的架构至少比飞腾先进两小代, 这个性能差异也是很大的. 
更新的指令集通过硬件实现指令, 在特殊场景下能够极大的提高性能.
但是这种新指令集一般对SPEC2006/2017的测试结果影响很小. 
所以可以看出来飞腾的跑分可能不比鲲鹏低多少,但是很多高级应用可能就会比鲲鹏差的比较多

架构-2

两路的S2500可以看到有
16个numa节点
两路的鲲鹏920只有
4个numa节点
越少的numa节点说明访存一致性越好

另外发现鲲鹏的缓存比飞腾的少.
虽然一般缓存越多性能越好, 但是怀疑是飞腾的多核之间的通信做的不够好
所以都是独立的一二级缓存, 导致缓存总数多. 但是实际性能不如鲲鹏. 

对应numa节点太多.缓存需要进行MESI算法就会增多,会极大的降低吞吐量.
架构设计上的不完备, 会导致飞腾的性能比不上鲲鹏. 

其他硬件兼容

1. 内存
发现我这边的飞腾的内存是等效 3200MT/S
鲲鹏的是 2933MT/S
理论上飞腾的访存性能应该要比鲲鹏的带宽要搭的
但是怀疑因为上面说的numa节点划分的问题.导致飞腾的访存比较拉胯
2. 硬盘
感觉鲲鹏的RAID卡是国际大厂的. 但是飞腾的我不太认识. 这一块可能跟主机厂商关系更大
但是感觉鲲鹏毕竟有之前超聚变投入的研发, 应该不比飞腾要差, 合作关系上要比飞腾要好.
3. 网络
网络栈上面不需要比较, 这是华为看家本领, 比飞腾强..
4. 操作系统
华为有OpenEuler, 中国电子旗下的银河麒麟也基于OpenEuler. 也比飞腾强.
5. 应用层
华为有毕昇JDK.. 这个也是碾压的存在..

汇总

虽然华为已经三年不允许找台积电代工
但是三年前流传下来的祖传CPU已经比飞腾能打. 
感觉除了倚天710, 鲲鹏在国产CPU还是第一档的存在. 

与飞腾与鲲鹏性能差异的一些思考相似的内容:

飞腾与鲲鹏性能差异的一些思考

飞腾与鲲鹏性能差异的一些思考 背景 自己在进行stress-ng以及sysbench的测试验证时发现: 飞腾的性能要比鲲鹏的性能有非常大的差距. 最近同事在现场也进行了压测, 也发现飞腾的性能不是特别好. 这里想简单总结一下自己学习过的资料,尝试分析一下为何差异这么大. 制程 注意 制程采用台积电发

[转帖]Intel、海光、鲲鹏920、飞腾2500 CPU性能对比

https://plantegg.github.io/2021/06/18/%E5%87%A0%E6%AC%BECPU%E6%80%A7%E8%83%BD%E5%AF%B9%E6%AF%94/ Intel 海光 鲲鹏920 飞腾2500 CPU性能对比 为了让程序能快点,特意了解了CPU的各种原理,

[转帖]不同CPU性能大PK

https://plantegg.github.io/2022/01/13/%E4%B8%8D%E5%90%8CCPU%E6%80%A7%E8%83%BD%E5%A4%A7PK/ 前言 比较Hygon7280、Intel、AMD、鲲鹏920、飞腾2500的性能情况 CPU型号Hygon 7280AM

[转帖]不同CPU性能大PK

https://plantegg.github.io/2022/01/13/%E4%B8%8D%E5%90%8CCPU%E6%80%A7%E8%83%BD%E5%A4%A7PK/ 前言 比较Hygon7280、Intel、AMD、鲲鹏920、飞腾2500的性能情况 CPU型号Hygon 7280AM

国产linux系统(银河麒麟,统信uos)使用 PageOffice 国产版在线动态填充 word 文件

PageOffice 国产版 :支持信创系统,支持银河麒麟V10和统信UOS,支持X86(intel、兆芯、海光等)、ARM(飞腾、鲲鹏、麒麟等)芯片架构。 在实际的Word文档开发中,经常需要自动填充数据到Word模板中,以生成动态的Word文档。例如,我们可以根据数据库表中已保存的个人信息,设计

[转帖]方神: 银河麒麟V10SP1桥接配置网卡总结

简介 公司计划再XC服务器上做业务软件的兼容测试,为了满足需要,想利用操作系统自带的KVM虚拟化做些虚拟机。再配置过程中发现虚拟机无法与宿主机通信,无法访问外网。以下对该问题做些简要的故障分析记录。 环境说明 服务器: 飞腾S2500*2 128Core 1T内存 操作系统: #版本 Kylin L

DTSE Tech Talk | 第10期:云会议带你入门音视频世界

摘要:本期直播主题是《云会议带你入门音视频世界》,华为云媒体服务产品部资深专家金云飞,与开发者们交流华为云会议在实时音视频行业中的集成应用,帮助开发者更好的理解华为云会议及其开放能力。 本期直播主题是《云会议带你入门音视频世界》,华为云媒体服务产品部资深专家金云飞,与开发者们交流华为云会议在实时音视

算法金 | 一文看懂人工智能、机器学习、深度学习是什么、有什么区别!

大侠幸会,在下全网同名[算法金] 0 基础转 AI 上岸,多个算法赛 Top [日更万日,让更多人享受智能乐趣] 引言:走进智能的世界 曾经,人工智能(AI)是科幻小说中的概念,与飞船、外星人并肩而立。 然而,随着时间的推移,AI不再仅仅是幻想的产物,它已经成为我们日常生活中不可或缺的一部分。 在A

阶段总结与展望——我的简历

我是一位刚进大二的大学生,在大数据这个专业已经学习了一年多了。 目前,对c++、python、java等编程语言有所了解,能够编写出一些基本的程序,当前接触了Linux操作系统、爬虫操作、Web前端、数据库,有一定的编写程序能力;在校期间获得了“python程序设计一等奖”。 在这门课程结束后,你将

CvT:微软提出结合CNN的ViT架构 | 2021 arxiv

CvT将Transformer与CNN在图像识别任务中的优势相结合,从CNN中借鉴了多阶段的层级结构设计,同时引入了Convolutional Token Embedding和Convolutional Projection操作增强局部建模能力,在保持计算效率的同时实现了卓越的性能。此外,由于卷积的