[转帖]国产服务器CPU架构与行业研究报告（节选一、二）

国产,服务器,cpu,架构,行业,研究,报告,节选 · 浏览次数 : 0

小编点评

## RISC-V 架构，开启软件生态的全新方向 RISC-V 是一种基于精简指令集 (RISC) 的开源指令集架构，它可以用来构建高效、低功耗的处理器。 2015年，RISC-V 成立后，许多软件厂商开始支持它，包括微软、苹果、Google、Huawei 和三星等。 **优势：** * 低功耗 * 低成本 *开源开发 * 模块化设计 * 简洁架构 * 高性能 **应用领域：** * 智能家居 * 工业控制 * 微控制单元 * AIoT **主要厂商：** * ARM 公司 * Apple * Google * Ampere * Marvell * Huawei * Samsung * 高通 **未来发展：** * RISC-V 生态正在迅速发展，许多新的开发工具和环境正在成为可用。 * RISC-V 架构可以帮助用户自由修改和扩展以满足他们的不同应用需求。 **其他相关信息：** * RISC-V 是 RISC-V 架构的缩写。 * RISC-V 的性能比 ARM 架构高，但其功耗更低。 * RISC-V 是 ARM 架构的竞争对手，但其性能和功耗要比 ARM 低。

正文

https://zhuanlan.zhihu.com/p/504539628
复制

收起

1 服务器与CPU技术综述

1.1 服务器综述

1.2 CPU综述

2 服务器CPU架构概况

2.1 服务器CPU的架构分类

2.2 CISC-x86

2.3 RISC- ARM

2.4 RISC-V

2.5 其他

1 服务器与CPU技术综述
1.1 服务器综述
1.1.1 服务器的发展历史
1.1.2 服务器的组成
1.1.3 服务器的分类
1.1.4 服务器集群与冗余技术
1.1.5 虚拟化技术
1.2 CPU综述
1.2.1 CPU的组成
1.2.2 CPU与GPU和DPU的分工
1.2.3 CPU指令集
2 服务器CPU架构概况
2.1 服务器CPU的架构分类
2.2 CISC-x86
2.3 RISC- ARM
2.4 RISC-V
2.5 其他
2.5.1 Alpha
2.5.2 MIPS
2.5.3 SPARC
3 服务器软件生态
3.1 操作系统
3.2 LLVM
3.3 （运行）库
3.4 云计算/容器/虚拟化
3.5 数据库/中间件
4 服务器CPU演进趋势
4.1 CPU优化的传统方向
4.1.1 工艺制程提升
4.1.2 并行度（核数）提升
4.1.3 缓存提升
4.1.4 专用指令集
4.2 CPU提升性能的新趋势
4.2.1 HBM与Chiplet
4.2.2 异构集成
4.2.3 存算一体
4.2.4 动态可重构/软件定义芯片
5 服务器CPU市场
5.1 服务器CPU产业链
5.2 服务器CPU市场规模
5.3 竞争格局
5.4 主要国外厂商
5.4.1 Intel
5.4.2 AMD
5.4.3 Amazon
5.4.4 SiFive
6 国产服务器CPU的市场机遇
6.1 国产服务器CPU发展路线
6.2 国内数字化需求
6.2.1 新基建
6.2.2 东数西算
6.2.3 5G与边缘计算
6.3 自主技术替代需求
6.4 互联网大厂的元宇宙布局
6.5 高端CPU与IP核心技术稀缺
7 国产服务器CPU厂商
7.1 x86架构：兆芯、海光
7.2 RISC-V架构：赛昉、平头哥
7.3 ARM架构：飞腾、鲲鹏
7.4 MIPS架构：龙芯
7.5 Alpha架构：申威

1 服务器与CPU技术综述

1.1 服务器综述

服务器是指通过网络为客户端提供特定服务的高性能计算机。它是一种软件与硬件的结合体，通过服务器操作系统来管理和充分利用服务器硬件的计算能力并提供服务。
服务器在网络中为其它客户机（如PC机、智能手机、ATM等终端）提供计算或者应用服务。服务器具有高速的CPU运算能力、长时间的可靠运行、强大的I/O外部数据吞吐能力以及更好的扩展性。

图表 1-服务器与客户机示意图

服务器的功能：作为网络节点，服务器负责完成数据的存储、传输、处理和发布。服务器的最大特点就是强大的运算能力或和存储数据能力，能在短时间内完成大量工作及负载大量文件资料存储，并为大量用户提供服务。

图表 2-服务器的工作原理（德太资本整理）

表格 1-不同服务器的功能（德太资本整理）

服务器被设计为每天24小时管理、存储、发送和处理数据，对比普通台式机，服务器需要有更高的处理能力、稳定性、可靠性、安全性、可拓展性和可管理性。

图表 3-一台典型服务器分解

服务器与普通台式机的对比如下：

表格 2-服务器与普通台式机对比（德太资本整理）

1.1.1 服务器的发展历史
20世纪60年代，吉恩·阿姆达尔创造最早的大型机(Mainframe)即IBM S/360大型机。在大型主机时代，曾经有“一个蓝色巨人与七个小矮人”的说法，包括：IBM—蓝色巨人以及Burroughs、UNIVAC、NCR、Control Data、Honeywell、General Electric和 RCA。大型机由于其安全性和高可靠性一直被应用于金融、证券等行业。随着时间的推移，大型机的许多劣势被暴露出来，价格昂贵、技术封闭、应用和部署都异常复杂，更为关键的是，大型机虽然在某些领域仍然有着不可替代的位置，但传统的集中式处理方式和封闭的软件堆栈已经无法适应越来越小型化、普及化的计算需求。

表格 3-服务器发展历史（德太资本整理）

在这样需求变化趋势下，1965年DEC公司开发了一款DPD-8小型机，掀起了一场小型机革命。20世纪80年代以RISC架构和UNIX操作系统为主导的小型机成为市场主流。小型机继承了大型机在安全性和高可靠性的性能，同时相比大型机来说体积变小、更易用、价格降低。而小型机跟普通台式机有很大差别——最重要的一点高高可靠性、高可用性、高服务性（RAS, Reliability, Availability, Serviceability）。

图表 4-服务器硬件的重要历史事件

20世纪90年代，x86架构的PC服务器开始崛起。PC服务器是一个通用开放系统，其操作系统安全性和可靠性相对较弱，但易用性、通用性、易开发性是最主要的优势。随着Linux和云计算等分布式计算模式的兴起，x86架构的PC服务器得到了更广泛的应用，近年来x86服务器的出货量占整个服务器市场的80%左右。
随着公司自身IT环境的复杂化，公司开始使用由多家供应商提供的商用服务器、操作系统和应用程序，他们必然面临着物理硬件利用率不足的问题 —— 每台服务器只能运行1个供应商特定的任务。另外还需要组建一个完整的运维团队来支持这些设备和软件的正常运作，对于中小型企业来说服务器的运维成本变得更加难以接受。

图表 5-单体服务器资源利用率低（数据来源：RedHat）

虚拟化技术的使用可以非常顺畅地解决2个重要问题：公司可对服务器进行分区，并在多种类型和版本的操作系统上运行传统应用。自此，服务器开始得到更高效利用，从而降低与采购、设置、散热和维护相关的成本。虚拟化的广泛适用性有助于减少对单家供应商的依赖，并为云计算的发展奠定了基础。

图表 6-从单一服务器到云计算

1.1.2 服务器的组成
服务器硬件主要包括处理器（即CPU）、存储器（Memory）、I/O接口等部件组成，其中三大核心零部件（处理器、内存、硬盘）的成本占服务器总成本75%以上。

图表 7-服务器的组成

处理器是服务器的核心与大脑。根据IDC数据，越高性能的服务器，其处理器相关成本占比越高，约为50-80%。在服务器中，CPU是性能的关键。

图表 8-不同类型服务器成本构成（数据来源：IDC）

1.1.3 服务器的分类
（1）根据形态分类
按照形态，服务器可以分为塔式服务器、机架式服务器、刀片式服务器、机柜式服务器。

表格 4-服务器按形态分类（德太资本整理）

（2）根据功能分类

表格 5-服务器按功能分类（德太资本整理）

1.1.4 服务器集群与冗余技术
（1）服务器集群技术
服务器集群（Server Clustering）是将很多服务器集中起来一起进行同一种服务，有着高可用性、可靠性和可伸缩性的特点。集群可以利用多个计算机进行并行计算从而获得很高的计算速度，也可以用多个计算机做备份，从而使得任何一个机器坏了整个系统还是能正常运行。
服务器集群通常运用于数据频繁更新的应用程序上，其中数据库服务器集群和计算服务器集群是最常见的服务器集群。

图表 9-服务器集群工作方式

通常服务器集群可分为三种类型：负载均衡集群（LB, Load Balancing）、高可用性集群（HA, High Availability）和高性能集群（HP, High Performance）

表格 6-服务器集群分类（德太资本整理）

（2）服务器冗余技术
服务器冗余技术是指采取两套同样独立配置的硬件、软件或设计等，防止在其中一套系统出现故障时，冗余配置部分的部件可及时介入并承担工作，由此有效减少故障时间和故障率。一般情况下冗余服务器保持离线状态，直到主服务器出现故障、停机或流量过大时，冗余服务器来代替主服务器或共享其流量负载。

图表 10-服务器冗余技术工作原理

1.1.5 虚拟化技术
虚拟化技术将计算环境与物理基础设施分开，计算资源（如CPU、内存和存储器）被视为一组可进行重新分配的资源，通过"Hypervisor" （虚拟机监控程序）的软件可直接连接到硬件，从而将一个系统划分为不同的、单独安全环境，即虚拟机（VM）。

图表 11-传统架构与虚拟化架构对比

虚拟化技术云计算服务的基础。虚拟化可提供多种重要的云计算功能，包括资源共享、虚拟机隔离和负载平衡。在云计算环境中，这些功能可提供出色的可扩展性、较高的资源池利用率、快速供应、工作负载隔离和更长的正常运行时间。

图表 12-虚拟化技术原理图（数据来源：RedHat）

虚拟化可分为数据虚拟化、桌面虚拟化、服务器虚拟化、操作系统虚拟化和网络功能虚拟化五大类。

表格 7-虚拟化的分类（数据来源：RedHat）

1.2 CPU综述

中央处理器（CPU）是计算机运算和控制的核心，负责读取指令、对指令译码并执行指令。

图表 13-Intel与IBM CPU平面图

CPU具有控制程序的顺序执行（指令控制）、产生完成每条指令的控制命令（操作控制）、对各种操作加以时间上的控制（时间控制）、对数据进行算术运算和逻辑运算（数据加工）、和对计算机运行过程中出现异常情况和特殊请求进行处理（处理中断）等功能。
1.2.1 CPU的组成
CPU主要由计算单元（ALU）、控制单元（CU）、寄存器（Register）、高速缓存器（Cache）和它们之间的连接总线构成。
控制单元负责协调并控制计算机各部件执行程序的指令序列，基本功能包括取指令、分析指令和执行指令。计算单元则负责根据控制器的命令执行计算机的算术运算、位移等操作以及地址的运算和转换。寄存器则负责计算过程中临时数据的存储。

图表 14-CPU的基本构成

图表 15-AMD Zen CPU架构

1.2.2 CPU与GPU和DPU的分工
中央处理器（CPU）遵循冯诺依曼架构，即存储程序顺序执行。因此CPU需要大量空间去放置存储单元和控制逻辑单元，相比之下计算能力只占了很小一部分，所以CPU更擅长逻辑控制，而非大规模并行计算。
图形处理器（GPU），最初是一种专门在个人电脑、工作站、游戏机和一些移动设备上做图形和图形相关运算工作的微处理器。GPU相比CPU有数量众多的计算单元和超长流水线，可以解决CPU在大规模并行运算中收到的速度限制。但是GPU无法单独工作，当需要处理大量类型统一的数据时，可由CPU调用GPU进行并行计算。

图表 16-CPU和GPU微架构对比

数据处理器（DPU，Data Processing Unit），是一种以数据为中心构造的专用处理器。DPU作为CPU的卸载引擎，接管网络虚拟化、硬件资源池化等基础设施层服务，释放CPU的算力到上层应用。此外，和CPU最大的不同在于，DPU是一个强IO型的芯片，其IO带宽几乎可以与网络带宽等同，并且DPU能直接连接网络，减少中间环节的延迟与速度损失。当DPU把大量网络数据初步处理完，传送给CPU，让CPU的决策更加高效。

图表 17-DPU加入后计算机架构对比

CPU、GPU、DPU三者优势互补可建立起一个更高效的计算平台：基础设施层的功能被卸载集成到DPU中，CPU进行控制和通用计算，GPU负责高性能计算。

图表 18-CPU、GPU、DPU的关系（德太资本整理）

1.2.3 CPU指令集
按照设计思路的不同，CPU可分为复杂指令集（CISC）和精简指令集（RISC）架构。
CISC（Complex Instruction Set Computer）：一条指令完成一个复杂的基本功能。单条指令集功能强，指令类型丰富完善，编译后指令数量较少，通用场景下性能具有优势。以x86架构为代表，主要用于桌面PC及服务器领域，配套软硬件丰富完善。
RISC（Reduced Instruction Set Computer）：一条指令完成一个基本动作，多条指令组合完成一个复杂的基本功能。指令集架构在不断完善，译码效率高，偏向低功耗领域优化。以POWER和ARM架构为代表。

表格 8-CISC和RISC对比

2 服务器CPU架构概况

2.1 服务器CPU的架构分类

根据指令集架构的不同，服务器CPU分为CISC和RISC两大类。

表格 9-CISC和RISC CPU对比（德太资本整理）

2.2 CISC-x86

x86是从Intel 8086发展出来的一套向后兼容的复杂指令集架构（CISC）。Intel在早期以80x86这样的数字格式来命名处理器，包括Intel 8086、80186、80286、80386以及80486，因此其架构被称为“x86”。由于数字并不能作为注册商标，Intel和AMD均在新一代处理器使用可注册的名称，如奔腾（Pentium）、酷睿（Core）、Xeon、锐龙（Ryzen，AMD推出）等。

图表 19-x86架构

主要特点：
（1）性能强、速度快。x86加强了乱序指令的执行，还增强了单核的多线程能力。
（2）功耗高。x86为了增强乱序执行能力需保持大部分的模块的开启状态，并且始终保持切换，因此导致耗电较高。

表格 10-Intel和AMD x86 CPU性能（德太资本整理）

x86架构适用于高主频、高功耗，覆盖高性能和通用计算场景。
Intel在上世纪80年代与Windows结成“Wintel”联盟，自此垄断桌面市场长达20多年。截止目前，服务器、桌面及移动PC市场是x86架构处理器主要应用场景。服务器市场中，x86架构服务器销量占比超过95%。

图表 20-2014-2020年全球x86服务器销售量占比（数据来源：IDC）

主要厂商：
x86目前整体呈现Intel及AMD两家独大的竞争格局。
Intel凭借先发优势及Wintel联盟的生态优势占据市场大多数份额。后来随着AMD第二代Epyc处理器“罗马”问世，AMD的服务器CPU市占率在短短两年内从1%增长到了8%；接着AMD发布第三代Epyc处理器“米兰”，其服务器市场份额有望达到15%。由于AMD服务器芯片的较高性价比及台积电7纳米制程技术的加成，越来越多的数据中心开始采购AMD的产品。

2.3 RISC- ARM

ARM（Advanced RISC Machine）是最早由艾康电脑开发出来的一款RISC处理器架构。ARM Ltd.本身不通过自有设计来制造或出售CPU，而是将指令集架构或IP内核通过授权给合作伙伴使用。由于其低功耗的特点，ARM广泛应用在移动通信领域和嵌入式系统设计中。

图表 21-ARM架构

自1985年ARMv1架构诞生起到目前已经发展到第八和第九代——ARMv8和ARMv9。自ARMv7后，处理器家族以Cortex命名，并分为Cortex-A、Cortex-R和Cortex-M三个系列。

表格 11-ARM指令集架构及处理器发展表（德太资本整理）

ARM指令集架构的主要特点：一是体积小、低功耗、低成本、高性能；二是大量使用寄存器且大多数数据操作都在寄存器中完成，指令执行速度更快；三是寻址方式灵活简单，执行效率高；四是指令长度固定，可通过多流水线方式提高处理效率。

表格 12-ARM CPU性能（德太资本整理）

ARM架构统治着移动终端和嵌入式领域。ARM 处理器由于其低成本、低功耗和低发热，非常适合轻型便携式电池供电设备，包括智能手机、笔记本电脑和平板电脑等移动终端以及其他嵌入式系统。全世界超过95%的智能手机和平板电脑都采用ARM架构。

图表 22-ARM应用领域（Source：ARM Q3 2020 roadshow slides）

ARM架构亦逐渐应用在PC端和服务器端。2020年苹果新一代Macbook Air首次使用了ARM架构的M1处理器；同年，亚马逊云计算服务器使用了ARM架构的Graviton2处理器支持。
软件生态：
ARM方面运行的系统主要有安卓、IOS、PadOS、Windows10移动版、Macos Big Sur等。原先适应x86指令集的软件需要经过翻译后才可运行，如苹果的 Rosetta2可以将x86指令转换为ARM指令，但是运行速度会减慢。
在软件方面，开源的应用软件及中间件阵容庞大，覆盖目前几乎所有的主流数据中心业务场景，例如云计算服务（OpenStack，Ceph，Kubernetes等），大数据业务（Hadoop，Spark等），高性能计算业务（OpenHPC），数据库（MySQL等）等。以Linaro为首的Arm64开源社区通过构建ERP（Enterprise Reference Platform）平台，建立了与这些开源应用软件和中间件的协同。通过持续迭代和演进，使得Arm64服务器完全支持这些开源软件的运行，基本使能开源软件生态。目前使用最广泛的云服务软件OpenStack社区在16年10月正式宣布了对Arm64服务器的支持。
在商用软件领域，Arm64服务器厂商一直积极和各个商用软件厂商展开合作，并获得了相关领域商用软件的支持。例如微软在今年3月正式宣布了用Arm64服务器支持内部使用的Azure云服务，Windows也早已宣布提供对ARM架构的支持。
主要厂商：
ARM 公司本身并不靠自有的设计来制造或出售CPU，而是将处理器架构授权给有兴趣的厂家，主要厂商有苹果、Google、Ampere、Marvell、华为、三星、高通等。
ARM的性能提升有限，其面对云计算基础设施的Neoverse N1系列处理器的主频在7nm工艺下仅能做到2.6-3.1GHz，远低于Power和x86的性能水平。ARM的优势在于低功耗，若要提升性能则需以功耗为代价。
在高性能场景需要乱序执行来提高处理能力，但ARM的指令强在次序执行，并且依靠多核而不是单核多线程来执行。
此外，ARM系统几乎都采用Linux的操作系统，而且几乎所有的硬件系统都要单独构建自己的系统，与其他系统不能兼容，这也导致其应用软件不能方便移植，严重制约了ARM系统的发展和应用。

2.4 RISC-V

RISC-V是一个基于精简指令集（RISC）原则的开源指令集架构（ISA）。RISC-V指的是RISC系列指令集的第五代产品，2010年始于加州大学伯克利分校。RISC-V ISA可以免费地用于所有设备中，允许使用者修改和重新发布开源代码并允许任何人设计、制造和销售RISC-V芯片和软件。

图表 23-RISC-V架构

由于兼顾数据的传输量和传输速度，同时在架构简易性、运行效率、成本、灵活开发和模块化设计上优势明显。RISC-V指令集架构具有低功耗、低成本、开源开放、可模块化设计、简洁、面积小、速度快等优点。

表格 13-RISC-V CPU性能（德太资本整理）

目前RISC-V以其低功耗低成本的特性，应用领域主要以智能家居、工控、微控制单元、AIoT等尚未被ARM和x86架构垄断的市场为主。RISC-V 架构的极致精简和灵活的架构以及模块化设计的特性，能够让用户自由修改、扩展以满足其不同应用需求和低功耗需求，因此逐步对 ARM 的市场竞争地位产生挑战
软件生态：
RISC-V目前的生态尚未成熟，还处于发展阶段。2015年RISC-V国际基金会宣布成立，致力于RISC-V的生态发展。从软件层面看，许多语言编译器都支持 RISC-V，包括流行的自由软件编译器GCC，以及Linux操作系统（32位和64位）。目前RISC-V已经具备基础的开发工具和环境，未来RISC-V生态发展需要依靠开源社区的持续推进和各大厂商的相互配合。
主要厂商：
2015年，RISC-V 基金会由硅谷相关公司发起并成立。自2015年成立至今，RISC-V基金会已拥有超过350家成员，成员中涵盖了半导体设计制造公司、系统集成商、设备制造商、军工企业、科研机构、高校等各类组织。其中，高级会员包括Google、SiFive、西部数据、阿里、华为、中兴等国内外知名科技企业。
在IP核方面，目前主要有以伯克利Rocket Chip为代表的开放免费设计模式，平头哥、SiFive的授权设计厂商，谷歌和英伟达为代表的自研厂商。
芯片设计/IDM企业方面，主要有平头哥玄铁910等为代表。

2.5 其他

2.5.1 Alpha
Alpha是DEC公司推出的RISC指令集系统，基于Alpha指令集的CPU也称为Alpha AXP架构，首批实现64位的 RISC微处理器，最初由DEC公司制造，并被用于DEC自己的工作站和服务器中。作为VAX的后续被开发，支持VMS操作系统，如 Digital UNIX。Alpha于1992年末推出，是专为高端台式机，工作站和服务器设计的微处理器架构。在之后DEC Alpha因为其生态太过封闭而逐渐消亡，在1998年被DEC公司出售给Compaq后被逐渐淘汰。
2.5.2 MIPS
MIPS架构是一种采取精简指令集（RISC）的处理器架构，1981年出现，由MIPS科技公司开发并授权，它是基于一种固定长度的定期编码指令集，并采用导入/存储（Load/Store）数据模型。经改进，这种架构可支持高级语言的优化执行。其算术和逻辑运算采用三个操作数的形式，允许编译器优化复杂的表达式。MIPS的特点是是高效率、低功耗，主要应用领域有移动和嵌入式工业。最初许多 MIPS 实现瞄准计算机类应用，比如工作站和服务器。在最近几年，MIPS CPU 较多的应用于嵌入式领域，包括路由器、可穿戴设备、家庭娱乐、网络、物联网（IoT）等。2021年，MIPS Technologies不再设计 MIPS 芯片，而将开发基于 RISC-V 架构的处理器。龙芯、芯联芯在内的厂商还在致力于以MIPS架构为基础的处理器的开发。
2.5.3 SPARC
SPARC（Scalable Processor Architecture）是RISC微处理器架构之一。基于1980年到1982年间加州大学伯克利分校关于Berkeley RISC的研究成果，并由一个独立、非盈利组织SPARC Internationl负责SPARC架构标准的管理和开发认证，是国际上流行的RISC微处理器体系架构之一。它最早于1987年由Sun电脑所设计，主要特点有开放性、可扩展性、寄存器窗口技术。目前已退出服务器市场，但航天领域仍有应用。

（连载中，未完待续）

本文作者：Vivian，YOYO，Victor

关于我们

德太资本由腾讯（http://0700.HK) 联合创始人和德迅投资创始人曾李青先生联合创立。德太资本在香港和中国大陆分别设有持牌机构，用于运作咨询及资产管理等受规管业务。德太资本专注消费和科技领域，是一家致力于为境内外创业者提供私募融资咨询服务、企业并购等服务的精品投行。