CPU算力提升与实际性能提升的关系

cpu,提升,实际,性能,关系 · 浏览次数 : 71

小编点评

**关于SPEC2006CPU和RedisBenchmark的理解最近研究过硬件CPU的性能和Redis这样单线程重IO服务突然想对比一下 brick 与 pipe 之间的效率情况,性能很大程度由CPU决定,但是其他部分的提升也会有一些促进作用。** 以下是两种方法的测试结果比较: | 变量 | SPECCPU型号主频测试平均数CPU信息 | Redisbenchmark平均数CPU信息 | |---|---|---| | 14nm Broadwell EP 虚拟化平台 CentOS8Golden 51182.3Ghz28.72017年 | 17.12012年 | 25.002.1Ghz | | 14nm Skylake SP CentOS8Golden 52182.3Ghz26.62019年 | 13.32013年 | 25.002.1Ghz | **主要发现:** 1. Intel的至强v1到v4世代的性能提升其实很慢,因为 AMD没有一战之力。 2. 当时的架构-制程的更新模式里面,制程升级带来的更多的是能耗而不是性能。 3. 进入至强可扩展阶段后。 Intel CPU因为有AMD ZEN家族的压力性能提升明显,但三代可扩展依旧无法打赢ZEN4 EPYC 4。 4. 性能提升主要由内存带宽以及其他架构优化的提升带来,而不是算力的提升。 5. 国产CPU的比相同值的IntelCPU的benchmark值要低一点,还是有很大需要优化的路要走。 **总结:** SPEC2006 CPU 的性能提升占 Redis benchmark 的提升越来越少。内存带宽以及其他架构优化的提升比算力的提升带来更多的收益。

正文

关于SPEC2006CPU和RedisBenchmark的理解


最近研究过硬件CPU的性能和Redis这样单线程重IO服务
突然想对比一下CPU算力提升占Redis性能提升的比率情况

性能很大程度由CPU决定,但是其他部分的提升也会有一些促进作用.
比如内存带宽,IO调度算法优化等.

最近发现使用完全相同的SPECCPU2006进行计算的结果与redisbenchmark的结果其实并不是严格对应的.
所以进行了一下简单对比.发现一些小规律. 
1. Intel的至强v1到v4世代的性能提升其实很慢.
   因为AMD没有一战之力,导致Intel疯狂挤牙膏.
2. 当时的架构-制程的更新模式里面.制程升级带来的更多的是能耗而不是性能. 
   架构升级能够带来更多的IPC提升和性能优化. 
3. 进入至强可扩展阶段后. Intel CPU因为有AMD ZEN家族的压力性能提升明显
   但是三代可扩展依旧无法打赢ZEN4 EPYC 
4. SPEC的提升占Redis benchmark的提升越来越少. 认为内存带宽以及其他
   架构优化的提升能够比算力的提升带来更多的收益. 
5. 国产CPU的比相同值的IntelCPU的benchmark值要低一点.还是有很大需要优化的路要走.

测试结果-SPEC

CPU型号 主频 测试平均数 CPU信息
E5-2620 2.0Ghz 17.1 2012年 32nm Sandy Bridge-EP 物理机
E5-2630V2 2.6Ghz 21.3 2013年 22nm Ivy Bridge-EP 虚拟化平台 CentOS7有超售
E5-2630V3 2.4Ghz 21.9 2014年 22nm Haswell-EP 虚拟化平台 CentOS8有超售
E5-2630V4 2.2Ghz 24.3 2016年 14nm Broadwell EP 虚拟化平台 CentOS8
Golden 5118 2.3Ghz 28.7 2017年 14nm Skylake SP CentOS7物理机
Golden 6150 2.7Ghz 35.1 2017年 14nm Skylake SP CentOS8
Golden 5218 2.3Ghz 26.6 2019年 14nm Cascade Lake CentOS8 虚拟机SSD
Golden 8369HB 3.3Ghz 36.8 2021年 14nm Cooper Lake-SP CentOS8 阿里云
AMD 9T34 3.4Ghz 60.7 2022年Q4 5nm AMD ZEN4 CentOS8 阿里云

执行命令

cd /speccpu2006-v1.0.1/ && source shrc && bin/relocate && nohup runspec --reportable -c x86.cfg -n 1 -r 1 --tuning base int &

国产化的-SPEC

CPU型号 主频 测试平均数 CPU信息
飞腾 2500 2.1Ghz 13.3 飞腾最新CPU,双路128核心1T内存
海光7285 2.5Ghz 25 中科曙光AMD ZEN1架构. 14nm 三星
鲲鹏920 2.6Ghz 27.8 华为2019年发布 双路128核心1T内存 台积电7nm
倚天710 2.7Ghz 52 阿里平头哥2022年发布ArmV9.0 单路支持128核心 台积电5nm

Redis benchmark与SPEC2006的结果总图

image

与CPU算力提升与实际性能提升的关系相似的内容:

CPU算力提升与实际性能提升的关系

## 关于SPEC2006CPU和RedisBenchmark的理解 ``` 最近研究过硬件CPU的性能和Redis这样单线程重IO服务 突然想对比一下CPU算力提升占Redis性能提升的比率情况 性能很大程度由CPU决定,但是其他部分的提升也会有一些促进作用. 比如内存带宽,IO调度算法优化等.

我在京东做研发第五期:京东云自研服务器,如何将开发成本降低 60% 的同时还更低碳环保?

随着互联网的不断发展,各类技术工程对cpu算力的需求持续飙高,这不仅带来了技术上的压力,对电力能耗的需求也越来越大。为在有限的电力内达到最佳的效果,京东云自研服务器围绕三大主轴,提升性能效率、降低整体成本,让地球环境可以永续经营。

[转帖]大模型训练,英伟达Turing、Ampere和Hopper算力分析

https://www.eet-china.com/mp/a219195.html 大 GPU 优势在于通过并行计算实现大量重复性计算。GPGPU即通用GPU,能够帮助 CPU 进行非图形相关程序的运算。在类似的价格和功率范围内,GPU 能提供比CPU 高得多的指令吞吐量和内存带宽。GPGPU 架构

部分信创CPU算力与IntelCPU的简单比较

部分信创CPU算力与IntelCPU的简单比较 摘要 最近一直想查看一下国产和非国产的CPU的性能比较 从最开始学习研究 sysbench 到周五晚上开始学习 stress-ng 今天查看github上面stress-ng的官网时 发现有一个ubuntu的网页不错,感觉可以用来进行一些简单计算 我主

Stress-ng 的简单学习

背景 想研究一下国产和不同架构,不通型号CPU的算力 也作为后续生产交付的基线准备. 学习各种不同工具进行简要测试. 安装 git clone https://github.com/ColinIanKing/stress-ng.git cd stress-ng make 然后就会在当前目录创建一个可

从“一云多芯”支持,看多元算力的全栈云方案

摘要:华为云Stack如何在不同CPU架构下,构建信创云平台多元算力的全栈解决方案?本文将为你具体阐释。 本文分享自华为云社区《从“一云多芯”支持,看多元算力的全栈云方案》,作者:徐安 华为云Stack资深架构师。 背景 华为云Stack作为华为云在政企市场的品牌,是政企客户智能升级的首选平台。随着

LeViT:Facebook提出推理优化的混合ViT主干网络 | ICCV 2021

论文提出了用于快速图像分类推理的混合神经网络LeVIT,在不同的硬件平台上进行不同的效率衡量标准的测试。总体而言,LeViT在速度/准确性权衡方面明显优于现有的卷积神经网络和ViT,比如在80%的ImageNet top-1精度下,LeViT在CPU上比EfficientNet快5倍 来源:晓飞的算

图解CPU的实模式与保护模式

作者:小牛呼噜噜 大家好,我是呼噜噜,由于x86保护模式是比较复杂晦涩的,所以特地单拉出来,实模式和保护模式一个重要的更新就是对内存的管理与保护,并且随着软件的发展,为了极致地压榨CPU的性能,硬件和软件都做出了许多努力,为了更好的管理内存,引入分段,分页,段页等等。本文会沿着内存的主线,穿插于实模

(性能测试)--记录一次高可用场景导致CPU资源升高

测试场景:高可用场景--限流测试; 被测交易:查询类交易,HTTP协议; 交易链路:jmeter - web - coimpre(前置服务) -- coimbp -- cobp (coimbp 、coimpre 都会访问同一个数据库); 注:cobp 为合肥机房,其他服务均为北京机房,要注意跨网段存

在英特尔至强 CPU 上使用 Optimum Intel 实现超快 SetFit 推理

在缺少标注数据场景,SetFit 是解决的建模问题的一个有前途的解决方案,其由 Hugging Face 与 Intel 实验室 以及 UKP Lab 合作共同开发。作为一个高效的框架,SetFit 可用于对 Sentence Transformers 模型进行少样本微调。 SetFit 仅需很少的