三星电子表示,这款芯片将采用2纳米制程工艺,这种工艺采用环绕栅极 (GAA) 晶体管架构,提升了芯片的集成度,使芯片在进一步微缩的同时还能保证性能。
同时,不管是手机还是 PC 厂商都认同端侧大模型的势在必行,只有结合端侧和云端大模型,计算终端的体验才能发生革命性的演变。但与此相对的是,端侧算力和存储配置也变得前所未有地重要。
HBM全称为High Bandwidth Memory,直接翻译即是高带宽内存,是一款新型的CPU/GPU内存芯片。通过将多个DDR芯片堆叠在一起后和GPU封装在一起,实现大模型时代的高算力、大存储的现实需求。
Cerebras成立于2016年,总部在美国加州,专注于研发比GPU更适用于训练AI模型的晶圆级芯片,为复杂的AI应用构建计算机系统,并与阿布扎比科技集团G42等机构合作构建超级计算机。基于其最新旗舰芯片构建的服务器可轻松高效地训练万亿参数模型。
相比之下,GPU作为通用的并行计算加速器,由于架构灵活、并行度高,非常适合深度学习的训练过程。但GPU在推理加速方面还有待进一步优化,无法像专用的NPU那样获得极致的能效比和低延迟表现。
一直以来,人工智能计算芯片在集成度、性能与功耗的平衡、并行处理能力、算法优化等方面存在技术挑战。三星电子表示,这次合作帮助三星电子进一步推出满足生成式AI的高性能计算需求的芯片。
与原版相比,中国特供版Gaudi 3拥有相同的96MB SRAM片上内存, 128GB HBM2e高带宽内存,带宽为3.7TB/s,拥有PCIe 5.0 x16接口和解码标准。
发表评论