指令集,架构,软核,硬核的简单学习

指令集,架构,硬核,简单,学习 · 浏览次数 : 329

小编点评

## CPU架构的理解 **CPU架构**是CPU的功能和性能的关键因素,它决定了CPU的性能和能效。 **指令集**是CPU执行指令的指令格式,它包含了指令格式、数据格式、操作码等信息。 **架构**是指令集的布局和设计,它决定了指令如何被处理。不同的架构会有不同的性能和效率。 **软核和硬核**是两种类型的CPU架构授权方式,每一种都有其独特的特点。 **软核**是指VHDL形式的IP,需要开发者自己进行物理设计和流片测试。 **硬核**是指设计好的电路板和各元件的详细参数,需要第三方厂商进行生产。 **指令集的类型** * **指令集授权**:开发者可以自由开发自己的指令集,并进行扩展。 * **架构授权**:厂商提供指令集设计标准,开发者只能使用已有的架构设计。 **主要架构类型** * **x86架构**:由Intel开发,广泛使用,性能和效率较好。 * **ARM架构**:由ARM开发,性能和效率较低,但成本较低。 * **MIPS架构**:由MIPS开发,性能和效率较低,但成本较低。 **总结** CPU架构是CPU功能和性能的关键因素,不同的架构会有不同的性能和效率。选择合适的架构取决于不同的需求。

正文

指令集,架构,软核,硬核的简单学习


前言

最近一直研究国产化信创知识.
之前的很多总结都比较底层. 
今天想着从稍微高一点的角度,尤其是CPU厂商的角度进行分析.

看了很多知乎大神,比如guee等的知识,很有感触.
也想借着周末的时间,学习与总结一下. 

国产化的脉络

国产计算机其实从上世纪五十年代就开始了. 103机,104机就是典型.
当时其实是电子管的计算机. 

也没有具体的CPU,内存之类的划分. 
但是是模仿苏联的计算机进行的国产化.

美国的计算机大部分是冯诺依曼,或者是哈佛架构进行的发展.
改革开放之后 国产计算机的发展一度中断.
在96年台海危机之后,以及新的瓦森纳协定以及实体名单的影响
第三代领导人核心才家吗继续发展国产计算机

其中国产CPU就是其中最关键和核心的一环.

国产化的分类

1. 购买指令集架构授权.
   龙芯和申威为代表, 龙芯购买的MIPS的指令集. 申威购买的Alpha
   两家企业MIPS和DEC都已经破产了. 只剩下国内还在继续发展.
2. 购买软硬核授权
   飞腾,鲲鹏,阿里倚天.等等都是这个套路.
   怀疑鲲鹏可能是软核心授权. 飞腾自己使用火星架构.但是感觉甚至比公版还要差.
3. 合资公司授权生产
   海光,兆芯,津逮 都是这个套路. 
4. RSIC-V开源指令集
   阿里的平头哥的部分产品,以及一些做RAID主控,或者是U盘主盘的厂商.

指令集

其实指令集不是最复杂的部分.
世界上也有非常多的指令集出现和发展过.
但是其实指令集也并非最重要的.
生态,兼容性,性能才是最重要的.

Intel的4004最初是给打印机等设备使用的.
但是随着IBM-PC技术的发展.才慢慢占据主流.
Intel本身是做存储出生, 他的大部分CPU都是向前兼容的. 
除了IA64. 已经失败了. 

MIPS 就是指令集授权比较多.
但是这样很容易导致出现生态碎片化. 
MIPS是学院派的人创建的指令集. 他们的指令集授权较为便宜. 但是软核和硬核的价格比较高. 
也就导致了 MIPS的发展百花齐放. 不同 厂商的CPU不完全兼容. 

架构

指令集在网上就是架构.
架构可以理解为是实现了指令集的设计内容. 
架构会有一些特性的复杂指令组合.
比如Intel的AVX512和AMD的 3DNOW!以及ARM的ASIMD等指令集.

前面也总结过, 像是飞腾就是ARMv8.0, 鲲鹏的920就是ARMv8.2
阿里倚天的就是ARMv9.0 
不同的架构实现的指令也不一样. 
比如最新的ARMv9 应该也实现了类似于BF16的数据类型来进行ML和DL
在AI领域能够实现更好的算法与性能. 

BF16是 8位整数长度, 7位精度, 一位符号位的总计16位长浮点类型.
BF16是 针对FP16的有效补充, 因为FP16仅有5未整数位,很容易就会溢出.
所以可以看到,越新的架构, 实现的特性越多, 对新服务,新技术的适应性越好. 

软核和硬核

核授权也称为IP授权,
这又分为两类,即软核和硬核。
可以把软核看作是电路原理图,
硬核除了原理图之外,还有设计好的电路板和各元件的详细参数。
比如最简单的照明电路就是由电源、导线、开关、电灯组成,这样一个电路图就像是软核,
而室内装修安装电线、电灯等时,电线的直径、长度、走线的路径,电灯的种类、功率、安装的位置等等,
就属于物理设计,也就是硬核。有了物理设计之后,才可以进行生产,CPU的生产过程被称为流片。

软核授权一般是指VHDL形式的IP(加密版),获得授权后需要自己做物理设计,再去流片测试,最后量产。
厂商可以进一步对微架构进行强化,但不得二次销售最佳化完成的处理器IP,
但是可以任意营销其最终制品(包含芯片、开发样版、完整系统等等)。

https://zhuanlan.zhihu.com/p/99807721

区别

MIPS的定价策略是核授权很贵,而架构授权很便宜。
有能力的公司都可以使用MIPS指令集开发自己的CPU,并且可以对指令集进行扩展,而不受限制。
这种模式在短期内造成了百花齐放的效果,但从长期而言,由于允许自行扩充指令,
导致生态碎片化,相互不兼容,从而影响了开发者和使用者的热情,这是MIPS没落的主要原因。

与MIPS相反,ARM则是核授权很便宜,架构授权很贵(据说大约每5年1亿美元),
以及每颗芯片卖出后的版税(约售价的1~2%)。
这样即使没有能力自己开发CPU核的公司,也能通过购买核授权来快速推出CPU产品,即使有研发能力的公司,
使用现成的 ARM IP 来集成CPU,也可以大幅度降低产品开发成本和缩短开发周期。
ARM 的商业模式渐渐驱逐了MIPS,并开辟和占领了更多市场,毕竟低成本的快速的产品方案可以提高市场竞争力,MIPS因此举步维艰。

人类社会都是趋利避害的. 能赚快钱一定会比老实本分来的直接与迅速. 

苹果与安卓的区别

苹果的A系处理器仅获取了ARM的指令集授权,而核心架构由它自行研发;
安卓芯片则采用了ARM的公版核心,可以说安卓芯片都是拿ARM的公版核心组装的芯片,
由于ARM自身的实力所限,公版核心性能向来落后于苹果的A系处理器,可以说高通芯片落后苹果两代。

苹果、高通、MTK、华为等获得了 安卓的架构授权.
飞腾应该也有架构授权,但是自己的改进能力比较有限, 基础也比大厂薄弱一些

苹果收购了多个苹果创业公司, 并且最近几年弄做出来了M1的甚至M2的Desktop级别的CPU
性能非常卓越, 一方面苹果有CPU和GPU共享的内存结构. 比x86架构必须走共享才能够互相方位又要优秀一到两代
并且因为内存也进行了统一封装, 访存的延迟和带宽也比x86更加优秀. 性能比较好. 
并且苹果自己掌握mac和ios的生态,可以定性优化. 所以不仅仅比大部分ARM厂商要好,甚至已经超越了Intel的部分产品. 

CPU的市场占有率

image

与指令集,架构,软核,硬核的简单学习相似的内容:

指令集,架构,软核,硬核的简单学习

指令集,架构,软核,硬核的简单学习 前言 最近一直研究国产化信创知识. 之前的很多总结都比较底层. 今天想着从稍微高一点的角度,尤其是CPU厂商的角度进行分析. 看了很多知乎大神,比如guee等的知识,很有感触. 也想借着周末的时间,学习与总结一下. 国产化的脉络 国产计算机其实从上世纪五十年代就开

[转帖]openeuler22.03实时系统安装及部署

openEuler预言 openEuler特性 融进了中科院软件所贡献的 RISC-V 新指令集架构支持内核的多核扩展性能力大大增强,提升了 CPU 多核的并行度,性能提升 20%采用轻量级虚拟化引擎 StratoVirt,一套架构支持虚机、安全容器、Serverless 三种场景,单虚机启动时间小

[转帖]使用GCC编译器实测兆芯KX-U6780A的SPEC CPU2006成绩

https://baijiahao.baidu.com/s?id=1722775453962904303 兆芯KX-U6780A是一款8核2.7GHz的使用x86/AMD64指令集(架构)的国产CPU,于2019年发布。兆芯于2013年成立,不久之后就使用VIA的CPU成品成功申请了“核高基”重大专

[转帖]国产服务器CPU架构与行业研究报告(节选四)

https://zhuanlan.zhihu.com/p/527034350 ​ 目录 收起 4 服务器CPU演进趋势 4.1 CPU优化的传统方式 4.1.1 工艺制程提升 4.1.2 并行度(核数)提升 4.1.3 缓存提升 4.1.4 专用指令集 4.2 CPU提升性能的新趋势 4.2.1 H

[转帖]Armv9 架构相比 Armv8 有何升级/区别:全面性能提升

https://baijiahao.baidu.com/s?id=1695708603852200216&wfr=spider&for=pc 自 2011 年 10 月 Arm 首次公布 Armv8 架构以来,已经有近 10 年的时间了,这是计算领域相当多变的 10 年,因为指令集架构通过移动领域到

[转帖]龙芯3A5000评测 国产自主指令集架构实战

https://tieba.baidu.com/p/8297036384?pid=147031768904&cid=#147031768904 芯片,是世界一大难题,很多人难以想象电子硬件中最小巧的的元件反而拥有最高技术含量,其中蕴含的逻辑就相当于以纳米为单位修建一座城市。 芯片器件中最著名的产物是

[转帖]Intel“革命性”X86s架构,带来哪些颠覆及影响?

https://www.eet-china.com/mp/a221822.html 英特尔发布了一份新的白皮书(Intel X86-S扩展架构规格),计划简化其处理器指令集架构(ISA)。英特尔提供了“x86-S”的ISA(指令集架构),其中“S”可能代表“简化”。它是当前 x86-64 ISA 的

国产CPU制造工艺与部分性能总结

国产CPU制造工艺与部分性能总结 背景 最近一段时间验证了很多国产CPU的性能. 感觉很多地方与之前的理解有一些偏差. 前几天总结了部分架构和指令集相关的差异 今天想着总结一下制造相关的部分. 希望能够更全面的了解国产化的相关内容. 频率相关 想到制程, 第一反应就是会影响主频这一重要属性 第一款打

[转帖]armv6、armv7、armv7s、armv8、armv64及其i386、x86_64区别

ARM处理器指令集 一. 苹果模拟器指令集: 指令集分析i386针对intel通用微处理器32架构的x86_64针对x86架构的64位处理器i386|x86_64是Mac处理器的指令集,i386是针对intel通用微处理器32架构的。x86_64是针对x86架构的64位处理器。 模拟器并不运行arm

[转帖]解读两大精简指令集:RISC-V和MIPS

https://www.bilibili.com/read/cv14392730?spm_id_from=333.999.0.0 关注 来源:内容来自「SIMIT战略研究室」,谢谢。 当前CPU的两大架构是CISC(复杂指令集)和RISC(精简指令集),x86是CISC的代表架构,占领了95%以上的