2026年第二季度末,Bloomberg Intelligence发布了一组引人注目的数据:定制AI芯片(ASIC)的季度出货增速首次显著超过了通用GPU的出货增速。这组数据的公布,被业界视为AI芯片产业发展史上的一个重要拐点。长期以来,英伟达的GPU凭借CUDA生态和通用计算能力几乎垄断了AI训练和推理市场,市场份额一度超过90%。但在2026年,这一"一家独大"的格局正在发生深刻变化——OpenAI、亚马逊、谷歌、微软等AI领域的关键玩家纷纷推出了自研或联合定制的AI芯片,AI算力市场正在从"通用"走向"专用",从"单一"走向"多元"。
AI云厂商大规模转向自研ASIC芯片,背后有两条清晰的商业逻辑。第一条是"降本逻辑"。当AI业务规模达到一定量级后,使用通用GPU进行推理计算的边际成本变得极其高昂。据亚马逊AWS的内部数据显示,使用自研Trainium芯片运行AI推理任务,每Token的综合成本比使用英伟达GPU降低约40%至50%。对于日处理数十亿次AI请求的云巨头来说,这意味着每年数亿美元的潜在成本节约。
第二条是"锁定逻辑"。通过自研芯片与自有AI平台(如AWS Bedrock、Google Vertex AI、OpenAI API)进行深度绑定优化,云厂商可以为客户提供独特的性能和价格优势,从而形成更牢固的客户锁定效应。谷歌TPU v7专为其Gemini系列大模型的训练和推理进行了针对性的架构优化,据谷歌内部测试数据,TPU v7在运行Gemini 3.0时的训练效率比同代英伟达GPU提升了约60%。OpenAI与博通合作开发的Jalapeño芯片则针对GPT系列模型的Transformer架构进行了专用加速器优化,预计将在2027年初量产。
当前ASIC定制芯片市场已经形成了清晰的"三级格局"。第一级是云厂商自研芯片——谷歌TPU v7、亚马逊Trainium 3和Inferentia 2、微软Maia 2。这些芯片专为自家云服务和AI平台量身定制,在特定工作负载上的性能表现远超通用GPU。第二级是AI公司与芯片设计服务商的联合定制——OpenAI与博通合作的Jalapeño芯片、Meta与Marvell合作的MTIA v3芯片。这些芯片由AI公司提出需求规格,博通或Marvell负责芯片设计和制造。第三级是第三方ASIC创业公司,以Groq、Cerebras和SambaNova为代表,它们以AI推理加速为切入点,各自推出了创新的芯片架构和产品。
在高盛全球研究所发布的报告中,2026年至2031年间全球AI领域总投资额预计将超过2万亿美元,其中约30%将用于专用AI芯片的研发和部署。博通CEO陈福阳在最新财报电话会上透露,博通已获得新客户的超百亿美元XPU订单,仅云服务商的定制芯片项目就从两年前的3个增长到了如今的18个,覆盖了传统云巨头、新兴AI基础模型公司以及国家层面的主权AI工程。ASIC定制芯片正在从"边缘创新"走向"主流方案"。
ASIC定制芯片的崛起对英伟达形成了前所未有的挑战。英伟达2026年第一季度的数据中心业务营收虽然仍在增长,但增速已经从前两年的200%以上放缓至约80%。分析师普遍认为,随着更多云厂商和AI公司转向自研芯片,英伟达未来在AI芯片市场的份额可能会从当前的约85%逐步下降至60%至70%。不过,英伟达也并未坐以待毙——黄仁勋在GTC 2026上发布了"主权AI基础设施计划",帮助各国政府建设基于英伟达GPU的国家级AI基础设施,试图在"芯片即服务"的新赛道中开辟第二增长曲线。
英伟达还加速了自身的定制化步伐。英伟达不再只卖"标准GPU",而是开始与云厂商合作提供"半定制"方案——客户可以基于英伟达的GPU核心进行一定程度的定制化修改,以满足特定工作负载的需求。这种"通用+定制"的混合策略,既是英伟达对ASIC浪潮的回应,也预示着未来AI芯片市场的竞争形态将更加复杂。未来五年,AI芯片市场将呈现"通用GPU+专用ASIC+可重构架构"三足鼎立的格局,每一种架构形态都有其最适合的应用场景和性价比区间。
全球ASIC芯片浪潮对于中国AI芯片产业而言,既是机遇也是挑战。从机遇角度看,ASIC的"专用化"趋势天然有利于后发追赶者——因为专用芯片的设计目标明确、优化路径清晰,相比"全能型"的通用GPU更容易实现技术突破。寒武纪、华为昇腾和海光信息等国产AI芯片企业已经在这方面进行了积极布局。特别是华为昇腾Atlas 950 SuperPoD提出的"单柜64卡、最大8192卡互联"的系统级方案,在超大规模AI训练场景中展现了不输于英伟达的方案级竞争力。
从挑战角度看,AI芯片的"去GPU化"并不意味着设计门槛的降低。相反,高性能ASIC芯片的设计涉及先进的制程工艺(5nm以下)、复杂的互连技术(Chiplet、Die-to-Die、硅光子学)以及庞大的软件生态适配工作。全球AI芯片产业正在从"拼硬件参数"进入"拼系统方案+软件生态"的新阶段,这一阶段的竞争壁垒远高于单纯的芯片设计。对于中国ASIC芯片企业来说,单点硬件能力固然重要,但如何构建完善的工具链、模型库和开发者社区,才是决定能否在全球AI芯片产业中占有一席之地的关键。国产AI芯片迈过"能用"的门槛后,正在向"好用"和"易用"的高地发起冲锋。