HBM4内存量产爬坡:三星SK海力士推进AI芯片存储革命

首页 / AI资讯 / 泛AI领域

2026年6月,三星和SK海力士同时宣布HBM4高带宽内存进入量产爬坡阶段。这一进展对AI芯片产业具有极为重要的意义——在GPU算力以每年2-3倍的速度增长的同时,AI系统的"内存墙"一直是一个被持续关注的瓶颈问题。

HBM4的技术参数与进步

HBM4相比上代HBM3e实现了多项重要升级。堆叠层数从12层提升至16层;单堆(single stack)容量达到64GB;带宽突破2TB/s。这些参数意味着配合新一代AI芯片时,内存带宽不再是系统性能的瓶颈。

为了直观理解HBM4的进步:GPT-4级别的万亿参数模型即使是采用FP8量化,单次训练仍需超过500GB的显存容量。这意味着至少需要8颗HBM4颗粒组成一个8堆栈的GPU模组。而在HBM3e时代,要获得同样的容量需要更多的颗粒,带来了更高的功耗和更大的PCB面积。

良率问题带来的成本压力

然而,HBM4的量产并非一帆风顺。目前HBM4的良率仅为60%-65%——这意味着每生产三颗芯片就有一颗因质量问题报废。低良率叠加更高的技术复杂度,导致单颗HBM4的成本较HBM3e高出约40%。这直接推高了B200 Ultra等高端GPU的整体物料成本。

三星和SK海力士都在积极提升良率。三星通过引入混合键合(Hybrid Bonding)技术——将芯片与芯片之间的连接间距从40微米缩小到15微米,减少了信号传输损耗——已成功将良率从55%提升到了63%。SK海力士则通过改进TSV(硅通孔)工艺,预计到2026年Q4将良率提升至75%以上。

GPU互联带宽的竞争

在内存容量提升的同时,GPU之间的互联带宽也在快速提升。在2026年6月的ISC高性能计算大会上,英伟达展示了基于NVLink 6的256节点集群,节点间互联带宽达到1.8TB/s,是NVLink 5的1.5倍。但这一性能提升的代价是巨大的功耗——单个DGX B200机箱的互联功耗高达1200W,占系统总功耗的15%以上。

AMD则选择了Infinity Fabric 4.0的开放路线,支持跨厂商PCIe 6.0互联。带宽虽低于NVLink 6(约1.2TB/s),但成本更低、兼容性更好。这一开放式路线正在为AMD赢得对供应链多元化有要求的企业客户。

补充分析:HBM4内存量产爬坡:三星SK海力士推进AI芯片存储革命所涉及的话题在2026年6月具有重要的产业意义。从行业发展的宏观视角来看,这一领域的技术进步和市场变化值得持续关注。综合多家行业媒体和分析机构的观点,该方向的发展潜力正在被越来越多的企业和投资者所认可。未来几个月内,随着更多技术和产品的发布,这一领域的竞争格局将进一步清晰,相关产业链上的企业也将在这一过程中找到各自的定位和增长机会。对于从业者和关注者来说,保持对这一动态变化的关注,将有助于更好地把握AI产业发展的脉搏。

发布时间:2026-06-25