[转帖]三星研发出首个基于存算一体技术的GPU大型计算系统 (收录于存算一体芯片赛道投资融资分析)

三星,发出,首个,基于,一体,技术,gpu,大型,计算,系统,收录于,芯片,赛道,投资,融资,分析 · 浏览次数 : 0

小编点评

**三星开发了世界上第一个基于数字存内处理 (PIM,可称存内计算或存算一体) 芯片(HBM-PIM)。** HBM-PIM 芯片采用20nm工艺,使7nm GPU性能提升了2.5倍。 它超越传统的冯诺依曼架构PIM 是指将计算单元与随机存取存储器 (DRAM) 集成在单个芯片上。 HBM-PIM 技术可以显著减少数据在CPU 和 DRAM 之间移动的频度并提升性能。 与仅配备 HBM 的 GPU 加速器相比,配备 HBM-PIM 的 GPU 加速器一年的能耗下降了约 2,100 GWh。

正文

https://zhuanlan.zhihu.com/p/591850021

 

陈巍谈芯:产业巨头已经打通存算一体技术的落地通道,存算一体技术加快应用部署。与未使用HBM-PIM(HBM-PIM GPU v.s. HBM GPU)相比,仅用20nm工艺就使7nm集群计算性能提升了2.5倍。这个思路也是本人在2016年给中科院提的研发建议。

三星电子于 12 月 12 日宣布,他们开发了世界上第一个基于数字存内处理 (PIM,也可称存内计算或存算一体) 芯片(HBM-PIM)的GPU的大规模计算系统。

三星电子高等技术研究院人工智能研究中心副主任崔昌圭(Choi Chang-kyu)在由三星电子主办的2022人工智能(AI)半导体未来技术大会上通过主题演讲披露了新计算技术的发展。他们通过组合来自AMD的96个GPU(MI100)构建了一个大型计算系统,每个GPU都加载了一个HBM-PIM芯片,并成功展示了存内处理 (PIM) 芯片的性能。这是一种存算一体技术,可以显著减少数据在CPU 和 DRAM 之间移动的频度并提升性能。

存算一体技术超越传统冯诺依曼架构

PIM 是指将计算单元与随机存取存储器 (DRAM) 集成在单个芯片上。这项技术有望有助于提高庞大的人工智能 (AI) 的性能。三星使了严格意义上的芯片内数字近存计算来提升AI计算性能。三星 HBM-PIM 芯片与其他公司 HBM 实现的不同之处在于,PIM 芯片上的每个存储块内都包含一个内部处理单元。

 

三星HBM-PIM阵列架构
基于存算一体技术的20nm HBM-PIM(DRAM工艺)使得7nm GPU性能增强2.5倍

根据三星去年在ISSCC发布的学术文章信息披露,该HBM-PIM使用的是三星的20nm DRAM工艺。负责计算的PCU与DRAM 阵列在同一个晶圆平面内,显著性能提升主要来自存算一体技术而非3D 堆叠封装。仅用20nm工艺的PCU进行简单的逻辑计算(DRAM工艺做逻辑计算其实不划算,外周的逻辑晶体管的实际栅长在32nm附近),就使得7nm工艺GPU集群的性能提升到2.5倍。

三星电子使用该系统训练语言模型算法T5(Text-to-Test Transfer Transformer)时,与未使用PIM时相比,性能提升了2.5倍,功耗降低了2.67倍。与仅配备 HBM 的 GPU 加速器相比,配备 HBM-PIM 的 GPU 加速器一年的能耗下降了约 2,100 GWh。三星表示,其 PIM 技术将对能源消耗和环境具有重大影响,可将集群的年能源使用量减少,相当于减少 960,000 吨碳排放。

三星HBM-PIM架构图

三星开发的另一个方向是使用 CXL(Compute Express Link)开放标准,用于高速处理器到设备和处理器到内存的接口,从而可以更有效地使用与处理器一起使用的内存和加速器。

CXL 可以与其他技术结合使用,例如 Processing-near-Memory (PNM),以帮助促进内存容量扩展。

与 PIM 一样,它通过使用内存进行数据计算来减少 CPU 和内存之间的数据移动。在 PNM 的情况下,计算功能在更靠近内存的地方执行,以减少 CPU 和内存数据传输之间发生的瓶颈。

三星本月早些时候推出了带有 CXL 的 PNM 技术,用于高容量 AI 模型处理。在测试中,基于 CXL 接口的 PNM 系统在推荐系统或需要高内存带宽的内存数据库等应用中性能翻倍。

相关阅读:

与[转帖]三星研发出首个基于存算一体技术的GPU大型计算系统 (收录于存算一体芯片赛道投资融资分析)相似的内容:

[转帖]三星研发出首个基于存算一体技术的GPU大型计算系统 (收录于存算一体芯片赛道投资融资分析)

https://zhuanlan.zhihu.com/p/591850021 陈巍谈芯:产业巨头已经打通存算一体技术的落地通道,存算一体技术加快应用部署。与未使用HBM-PIM(HBM-PIM GPU v.s. HBM GPU)相比,仅用20nm工艺就使7nm集群计算性能提升了2.5倍。这个思路也是

[转帖]麒麟系统:中国火星探测器御用的国产OS系统!

中国首个火星探测器“天问一号”已经成功着陆,并拍摄了第一手的火星地貌高清大图。据央视报道,天问一号使用的操作系统也是我国自研的。 据报道,天问一号着陆巡视器已成功着陆火星,它使用的是我国自主研发的麒麟操作系统。研制该系统的团队,平均年龄不到30岁。 早在“嫦娥三号”任务中,该团队就加班加点修改了约1

[转帖]Linux 网络栈接收数据(RX):配置调优(2022)

http://arthurchiao.art/blog/linux-net-stack-tuning-rx-zh/ 本文尝试从技术研发与工程实践(而非纯理论学习)角度,在原理与实现、监控告警、 配置调优三方面介绍内核5.10 网络栈。由于内容非常多,因此分为了几篇系列文章。 原理与实现 Linux

[转帖]Linux 网络栈原理、监控与调优:前言(2022)

http://arthurchiao.art/blog/linux-net-stack-zh/ Published at 2022-07-02 | Last Update 2022-07-02 本文尝试从技术研发与工程实践(而非纯理论学习)角度,在原理与实现、监控告警、 配置调优三方面介绍内核5.1

[转帖]国产服务器CPU架构与行业研究报告(节选三)

https://zhuanlan.zhihu.com/p/510768926 ​ 已认证帐号 已关注 2 人赞同了该文章 目录 1 服务器与CPU技术综述1.1 服务器综述1.1.1 服务器的发展历史1.1.2 服务器的组成1.1.3 服务器的分类1.1.4 服务器集群与冗余技术1.1.5 虚拟化技

[转帖]报告显示,openEuler 引发中国服务器操作系统发展从“量”变到“质”变

https://linux.cn/article-15211-1.html 近日,赛迪顾问软件与信息服务业研究中心通过广泛调研,编制完成了《中国服务器操作系统市场研究报告(2022H1)》(以下简称“报告”)。报告从市场规模、市场结构和市场特点三方面对 2022 年上半年中国服务器操作系统市场发展情

[转帖]GaiaDB

GaiaDB tag标签 编辑 简介:2020年8月20日,百度自研云数据库品牌 GaiaDB 重磅发布!旗下有三款云数据库产品:云原生数据库 GaiaDB-S、分布式关系型数据库 GaiaDB-X、图数据库 GaiaDB-G。 2020年8月20日,百度自研云数据库品牌 GaiaDB 重磅发布!旗

[转帖]【文章导读】什么是旁道攻击?Meltdown Redux英特尔漏洞(MDS攻击);KAISER:从用户空间隐藏内核(KAISER);Meltdown/Spectre分析

Table of Contents 黑客词典:什么是旁道攻击? Meltdown Redux:Intel缺陷使黑客窃取了数百万台PC的秘密 三重熔毁:有多少研究人员同时发现了20年的芯片缺陷 KAISER:从用户空间隐藏内核 迟到的Meltdown/Spectre分析 黑客词典:什么是旁道攻击? h

[转帖]三星固态硬盘总结

https://www.cnblogs.com/hongdada/p/17260098.html 年代颗粒消费级产品制程企业级产品oem产品 2012 平面2D 840Pro,840Evo 21nm Sm843t Sm841 2015 平面2D 19nm Sm951 2013 第一代V-NAND 2

[转帖]IBM 、英特尔、台积电、三星2nm先进工艺的豪赌(编辑中,收录于先进芯片技术深度解读)

https://zhuanlan.zhihu.com/p/512405788 根据摩尔定律,芯片上的晶体管数量每两年翻一番。这一定律的实现在12nm之后变得愈来愈简单。 头部半导体制造厂已经量产了 5 nm芯片。工艺从FinFET逐渐过渡到GAA甚至是VTFET。 目前半导体制造厂在一掷千金,改善G