字节跳动发布Ouro模型:将推理能力构建到预训练阶段

2025-11-04 236 0

Ouro 是字节跳动 Seed 团队联合多家机构推出的循环语言模型(Looped Language Models)项目,旨在将推理能力直接构建到预训练阶段,而非依赖训练后的 “思维链” 等显式文本生成过程。该项目包含 Ouro-1.4B、Ouro-1.4B-Thinking、Ouro-2.6B、Ouro-2.6B-Thinking 等多类预训练模型,核心采用共享权重层堆栈的循环架构,集成学习到的 “退出门” 实现自适应计算 —— 简单输入可提前退出以节省资源,复杂输入则分配更多迭代次数进行深层处理,在潜在空间构建 “潜在思想链” 以提升知识操纵能力。

相关文章

OpenClaw v2026.4.15 更新:自动检测发布
OpenClaw v2026.4.15 更新:自动检测发布
阿里开源Qwen3.6-35B-A3B:30亿激活参数实现顶尖智能体编程
Claude Opus 4.7:AI不再只长脑子,它开始长出双手
它看着你工作:Gemini Mac 时代,屏幕没有秘密
代码无国界,但开发者有——AI工具国界化的2026启示录