OpenAI 发布首款自研芯片 Jalapeño:与 Broadcom 合作,九个月完成设计

北京事件 6 月 24 日,OpenAI 正式发布了旗下首款自研 AI 推理芯片,代号 Jalapeño(发音:hah-lah-PAY-noh)。这款芯片是与半导体巨头 Broadcom 联合开发,历时仅九个月即完成设计——OpenAI 官方甚至表示,芯片开发本身也借助了自家 AI 模型的协助。

## 九年自研路,终于落地

OpenAI 对自研芯片的探索可以追溯到大约一年半以前。2025年10月,OpenAI 与 Broadcom 的合作正式对外官宣,但彼时外界对芯片的具体细节知之甚少,仅仅知道两家公司计划在 2026 年开始部署。而今天,这款芯片终于有了自己的名字和完整规格。

Jalapeño 是一款 ASIC 专用芯片(Application-Specific Integrated Circuit),也被 OpenAI 称为 Intelligence Processor(智能处理器),定位为 AI 推理加速器。ASIC 的特点是为特定任务定制,在性能和能效上往往优于通用型芯片,只是灵活性不如 Nvidia 的 GPU。OpenAI 选择 ASIC 路线,正是看中了其在特定推理场景下的成本优势和效率提升。

## 九个月完成设计,AI 帮助设计 AI

传统芯片设计周期通常需要两到三年,而 OpenAI 这次仅用九个月就完成了 Jalapeño 的设计。官方博客透露,OpenAI 自己的 AI 模型深度参与了芯片设计流程,帮助优化了内核架构、内存调度、网络互联以及服务模式。OpenAI 硬件项目负责人 Richard Ho 表示:「我们根据 OpenAI 研究人员的深度合作,从零开始围绕 LLM 推理需求优化了芯片架构,包括内核、内存移动、网络连接和服务模式。」

目前,工程样片已在实验室中运行在目标频率和功率下,实测工作负载包括 GPT-5.3-Codex-Spark 等生产级模型。OpenAI 宣称,早期测试显示 Jalapeño 的每瓦性能显著优于当前最先进的替代方案。

## 专注推理,不碰训练

Jalapeño 是一款推理专用芯片,专注于运行已经训练好的 AI 模型(即推理阶段),而非模型预训练。对于 OpenAI 而言,推理是 AI 真正触达用户的环节——每次用户向 ChatGPT 提问、在 Codex 中执行代码任务、或调用 API,本质上都在消耗推理算力。OpenAI 在官方博客中表示:「推理是 AI 走向用户的最后一公里。每一次成本、速度和可靠性的提升,都意味着用户得到更快的 ChatGPT 回答、更少等待的 Codex 任务、更低成本的 API 调用,或是在高峰时段更稳定的服务。」

这也意味着,OpenAI 在预训练环节仍将继续依赖 Nvidia 的 GPU 集群,但哪怕只是推理成本的轻微下降,对其整体财务状况也是重大利好——推理在 AI 公司的日常运营成本中占据了大头。

## 合作模式:OpenAI 设计,Broadcom 制造,Celestica 组装

OpenAI 负责芯片架构设计,Broadcom 提供硅实现、网络互联和连接技术,Celestica 则负责电路板、机架系统集成和规模化生产。这种分工让 OpenAI 无需自建晶圆厂,就能拥有定制化芯片能力。

## 目标:2026 年底首批部署

官方表示,Jalapeño 芯片的物理样片已于 6 月 24 日当天交付 OpenAI,首批部署目标时间节点为 2026 年底,并在未来几年持续扩大规模。这只是 OpenAI 多代计算平台的第一步,后续还会有更强大的迭代产品。

## 行业背景:AI 公司掀起自研芯片潮

OpenAI 是最后一家加入自研芯片行列的大型 AI 实验室。Google 早已有 TPU(张量处理单元),Amazon 也有 Trainium 和 Inferentia,微软近期也透露了自研 AI 芯片计划。Nvidia 在 AI 训练和推理市场占据绝对主导地位,但也正因为其 GPU 价格昂贵、供货紧张,各大 AI 公司都在寻求替代方案。OpenAI 此次与 Broadcom 合作,走的是一条轻资产路线——不自己建厂,而是借助 Broadcom 的制造和封装能力。

一句话总结:OpenAI 首款自研芯片 Jalapeño 问世,不是为了替代 Nvidia 在训练上的地位,而是要在推理战场上抢占成本和效率的制高点——这或许是 OpenAI 迈向盈利的关键一步。