http://www.ichyang.com/post/2358.html
相对于从诞生之初就处于舆论风口浪尖的“龙芯”,中国另一款走全自主道路的芯片“申威”,相比之下就低调得多。陆媒近日刊文试图揭秘这款由军方秘密开发的全自主芯片。
无论是传统纸媒还是网络媒体,“申威”的曝光率比起“龙芯”、“海思”、“展讯”等国产芯片都要低得多,而且相比于备受吐槽的“龙芯”,“申威”极少成为网媒和充满虐气的网民的攻击对象。
由于前期一系列短视行为,中国在超算和国防、信息安全竟然陷入无“芯”可用的困境。解放军总参谋部第五十六研究所(无锡江南计算技术研究所)于2003年开始着手设计中国人自己的高性能芯片——“申威”。
第五十六研究所主要研究方向有计算机系统结构、并行/分布处理与智能计算机系统、计算机软件、人工智能与智能控制、计算机与通信、计算机信息处理与应用。
该所在计算机、通信及机电一体化等领域共荣获国家、军队科学技术成果奖300多项,其中国家科学技术进步特等奖3项,军队科学技术进步一等奖35项。1987、2000年,中央军委两次为56所荣记集体一等功。1993年中央军委授予56所“勇攀科技高峰先进研究所”荣誉称号。
申威和龙芯作为国内硕果仅存的两个走自主可控路线的IC设计单位,和龙芯一样在积极构建自己的软硬件体系以保障从软件和硬件两个方面实现安全可控。申威开发了自己的神威睿智编译器,研发了基于Linux的神威睿思操作系统。于2012年9月投入使用的神威蓝光超算使用了8704片申威1600,搭载神威睿思操作系统,实现了软件和硬件全部国产化。
五十六所以Alpha指令集为基础,扩展出自己的指令集,并在2006年设计出具有自主微结构的申威1;2008年完成的申威2;2010年研发的申威1600;2012年研制出申威1610和申威410;2014年底,申威5成功流片。根据公开论文显示,申威5很有可能是一款集成了4个管理核心和256个运算核心的高性能众核CPU。
神威蓝光超算总投资6亿元,于2012年9月投入使用。神威蓝光超级计算机使用了8704片申威1600,搭载神威睿思操作系统,实现了软件和硬件全部国产化。
为摆脱国外掣肘,中国军方在计算机领域投入甚多
神威蓝光具有以下特点:一是全部使用申威1600芯片;二是稳定性较好;三是液冷系统高效可靠;四是高密度封装;五是整机功耗低,性能功耗比高;六是整机效率高。
神威安全可信PC是搭载申威410,针对有较高安全需求的党政军单位,元器件实现100%国产化。不过,因申威410单核性能太弱,软件生态极度贫乏,仅限于满足特殊部门使用。因此,搭载申威410的安全可信PC不仅价格贵,整机性能弱,而且软件生态贫乏,基本不具备在民用PC市场的竞争力。
虽然申威和龙芯一样是走独立自主路线,但申威的道路要比龙芯平坦得多。这使因为,申威是军方项目,不仅不用面对IC设计公司最头痛的技术人才流失问题,还能在人力物力财力可以得到军方充足保障。
此外,申威专注于超算领域,不存在龙芯在PC市场遇到的软件生态贫乏和产业联盟弱小导致产品缺乏市场竞争力的困境。申威有自己的指令集、微结构、CPU、编译器、操作系统就足以在超算领域立足。
最后,申威是军方项目,而神威超算更是国家级工程,申威的软件和硬件产品完全可以在体制内完成内部循环。
1、申威的诞生
上世纪60-70年代末,中国在高性能计算机领域也曾有过自己的辉煌——哈军工曾经制造出具有分时操作系统和汇编语言、FORTRAN语言及标准程序库的441B系列计算机。北京大学、北京有线电厂等单位联合研制150计算机。清华大学、北京无线电三厂研制生产了130、131、132、135、140、152、153系列计算机近千台。国防科大成功研制出151计算机,华东计算技术研究所成功研制1001中型集成电路计算机和HDS-9计算机,其中HDS-9计算机每秒运算达500万次,更为难能可贵的是,这些计算机的软件和硬件是中国人自己编译和制造的。
但在80年代因迷信“造不如买、买不如租”、“市场换技术”等理论,放弃了自主芯片的研发转而大量外购国外芯片。从80年代的银河1超算开始,到90年代的银河2、银河3,曙光系列超级计算机都没有中国“芯”,在技术上始终受制于人。即使是在几年前的天河2号上,也只有4096片飞腾1500作为计算节点前端处理器,而飞腾1500是在SUN的UltraSPARC T2基础上做的改进版本。
为解决在超算和国防、信息安全无“芯”可用的困境。总参谋部第五十六研究所(无锡江南计算技术研究所)于2003年开始着手设计中国人自己的高性能芯片。申威从此踏上了征途。
(超云申威服务器)
2、申威的娘家
申威由总参谋部第五十六研究所(无锡江南计算技术研究所)设计,上海高性能集成电路设计中心是56所的马甲。
该研究所创建于1951年6月,坐落于无锡。主要研究方向有计算机系统结构、并行/分布处理与智能计算机系统、计算机软件、人工智能与智能控制、计算机与通信、计算机信息处理与应用。八十年代以来,在计算机、通信及机电一体化等领域共荣获国家、军队科学技术成果奖300多项,其中国家科学技术进步特等奖3项,军队科学技术进步一等奖35项。1987、2000年,中央军委两次为56所荣记集体一等功。1993年中央军委授予56所“勇攀科技高峰先进研究所”荣誉称号。
(瘦客户端)
3、申威的指令集和技术渊源
申威属于Alpha阵营,指令集也是基于Alpha进行扩展。
申威的技术来源是于DEC的Alpha 21164。DEC的技术实力很强,Alpha性能更是惊艳,AMD就曾经购买了Alpha 21264的技术资料,挖走了部分DEC的技术人员后,开发出自己的K7微结构。
DEC是技术实力比人强,但商业模式不如人而失败的典型例子,Alpha也被几经转手,先被康柏收购,后被惠普雪藏。目前Alpha已经被束之高阁,指令集和微结构都已经不再更新,技术专利大多已过期或快过期了。申威是目前Alpha阵营中仅存的硕果,拥有自主扩展指令和发展路线的自主权。
至于购买国外指令集,并以此为基础扩展指令,发展出自己的指令集是否是自主可控等问题,请参见本人撰写的另一篇文章《15年了,龙芯拿什么与国外芯片巨头对抗》。
(防火墙)
4、自主可控体系构建
申威和龙芯作为国内硕果仅存的两个走自主可控路线的IC设计单位,和龙芯一样在积极构建自己的软硬件体系以保障从软件和硬件两个方面实现安全可控。
申威开发了自己的神威睿智编译器,研发了基于Linux的神威睿思操作系统。加上超算领域不像PC领域那样存在软件生态的掣肘,申威构建自主技术体系的道路可谓一片坦途——于2012年9月投入使用的神威蓝光超算使用了8704片申威1600,搭载神威睿思操作系统,实现了软件和硬件全部国产化。
5、申威历程
56所(江南所)以Alpha指令集为基础,扩展出自己的指令集,并在2006年设计出具有自主微结构的申威1,申威1是一款130nm制程工艺的单核心CPU,主频900MHz,集成5700万晶体管。2008年完成的申威2,是一款130nm制程工艺的双核CPU,主频1.4GHz。
如果说申威1和申威2更像是56所磨砺技艺的作品,是对Alpha21164技术的消化吸收,那么2010年研发的申威1600则是56将国外技术融会贯通后,推陈出新的产品。申威1600是一款65nm制程工艺的16核CPU,主频1.1G,双精浮点140G。申威1600被用于神威蓝光超算。
也许是因Alpha当年强悍的性能,本人对源自Alpha的申威抱有很高的期望。但根据国家高性能集成电路设计中心公布的论文显示,申威1600的SPEC2000测试分数只能说是差强人意,唯有性能功耗比和 LINPACK测试聊以自慰。
平心而论,虽然申威1600处理器的单核性能有限,但16核的可扩展性很好,实现了比较理想的多核性能加速比。
申威1600性能参数如下图所示:
2012年,56所研制出申威1610和申威410,申威1610为40nm制程的16核CPU,集成10亿晶体管,主频1.6G,最大功耗50W,双精浮点运算200G。申威410为40nm制程的4核CPU,集成2.7亿晶体管,主频1.6G。前者用于服务器,后者用于PC,支持中标麒麟操作系统。这两款产品同样遭遇了龙芯在PC市场遇到的软件生态贫乏和产业联盟弱小导致产品缺乏市场竞争力的困境,加上申威410单核性能太弱,搭载申威410的安全可信PC基本不具备在民用PC市场的竞争力。
2014年底,申威5成功流片。根据一篇由坐落于无锡的数字工程与先进技术国家重点实验室和坐落于北京的国家并行计算机工程技术研究中心联合发布的论文,申威5很有可能是一款集成了4个管理核心和256个运算核心的高性能众核CPU,双精浮点运算超过1T,核内 linpack效率93%,并有很高的性能功耗比。
(申威5结构图)
申威是军方项目,而神威超算更是国家级工程,申威的软件和硬件产品完全可以在体制内完成内部循环。而龙芯的很多产品必须到商业市场上去拼杀。
申威自2003年诞生以来,基于Alpha自主扩展了指令集,共设计了申威1、申威2、申威1600、申威1610、申威5五款芯片,自主研发了神威睿智编译器和神威睿思操作系统,推出了搭载申威芯片的PC、服务器、高性能计算机、超算、防火墙、机架式存储服务器、大规模集群存储系统、瘦客户端、QDR HCA卡、神威云等产品,为国家信息安全和超算建设竭尽所能,圆满完成了国家交付的任务。