Skip to content

Transformer作者Noam Shazeer跳槽OpenAI:GPT中的那个T,终于归队

darlingyc

今天AI圈最大的新闻来了——Transformer架构的共同发明人、Google Gemini项目联席负责人 Noam Shazeer,正式宣布加入OpenAI。路透社于2026年6月18日上午率先报道,Shazeer本人数小时内便在X上确认了这一消息。这是近年来Google DeepMind向OpenAI输送的最高级别人才,也是AI行业最重量级的一次”回流”。

说到Shazeer,必须先聊清楚他到底是谁。2017年,他与另外七位Google研究员共同发表了那篇改变世界的论文《Attention Is All You Need》,正式提出了Transformer架构——也就是今天几乎所有大语言模型的核心底层技术。你在用ChatGPT、Claude、Gemini、甚至所有开源LLM时,背后运转的那个Attention机制,追根溯源都来自这篇文章。换句话说,没有Transformer,就没有今天的生成式AI浪潮。

Shazeer在Google的履历堪称传奇。他早在2000年便加入Google,在Google Brain团队工作了超过二十年。期间他主导了T5模型(Text-to-Text Transfer Transformer)的研发,这是最早的大规模预训练语言模型之一,也是BERT的直接竞争对手。此外他还领导了Meena和LaMDA项目——这两个项目后来演变成了Google的Bard聊天机器人。可以说,Transformer论文之后,Shazeer几乎以一己之力定义了Google的大模型研究方向。

2021年,看到AGI浪潮的到来,Shazeer选择走出Google,联合创办了Character.AI。这家公司的聊天机器人在发布后迅速积累了数千万用户,一度成为全球最受欢迎的AI情感陪伴产品。Character.AI的估值也一路飙升,成为AI领域最受关注的独角兽之一。

2024年,Google使出了一招重拳——以27亿美元将Character.AI的核心团队打包收购,Shazeer本人也随之重返Google,担任Gemini项目的联席负责人。这一交易当时震动了整个AI圈,业界普遍认为Google是用”高价买人”的方式在AGI竞赛中补齐人才短板。

然而仅仅一年半之后,Shazeer再次转身离开,这次他选择的目的地是OpenAI——也就是那个在GPT这个名称里用到了Transformer技术、却并非他本人所在公司的机构。有观察者用一句话精辟地总结了这个故事的讽刺意味:”GPT里的T,终于去给那三个字母的另外一边打工了。”

OpenAI目前正在为IPO做最后的准备,据悉已向美国证券交易委员会提交了保密文件。在此关键时点引入Shazeer这样的顶级人才,显然不止是为了填补研究团队的空缺。外界普遍猜测,Shazeer将帮助OpenAI在推理模型和多模态模型方面建立更深的护城河,也可能参与下一代GPT的架构设计。

Google方面目前对该消息不予置评。但一个不争的事实是:Google苦心培养的AI人才,正在以越来越快的速度流向竞争对手——Character.AI模式告一段落后,Google似乎又成了为整个行业输送顶尖大脑的”黄埔军校”。