核心摘要 (TL;DR)
DeepSeek 于 2025年12月1日 正式发布 V3.2 正式版 及 V3.2-Speciale 研究版。新版本在保持高效推理的同时,首次实现了思考模式与工具调用(Tool Calls)的深度融合。基准测试显示,V3.2 标准版综合能力已达 GPT-5 水平,而 Speciale 版本在数学与编程竞赛中表现出人类顶尖选手水平(ICPC 全球总决赛银牌、IOI 金牌)。目前,Web 端、App 及 API 已全线升级。

1. 什么是 DeepSeek V3.2?
DeepSeek V3.2 是深度求索(DeepSeek)公司基于 DeepSeek Sparse Attention (DSA) 稀疏注意力机制推出的最新一代开源大模型。此次更新包含两个核心版本,分别针对通用应用和极限推理场景进行了优化。
DeepSeek-V3.2(标准版)
- 定位:平衡推理能力与响应速度,专为通用 Agent 任务和日常问答设计。
- 核心突破:相比竞品(如 Kimi-K2-Thinking),V3.2 大幅降低了输出长度,显著减少了 Token 消耗与用户等待时间,同时保持了顶级的逻辑输出质量。
- 性能对标:公开评测显示其能力与 GPT-5 持平,仅略低于 Google 的 Gemini-3.0-Pro。
DeepSeek-V3.2-Speciale(极限版)
- 定位:探索模型智力边界的“长思考”增强版,结合了 DeepSeek-Math-V2 的定理证明能力。
- 适用场景:复杂的数学证明、逻辑验证及高难度编程竞赛。
- 主要限制:仅供研究使用,不支持工具调用,API 开放时间截止至 2025年12月15日。
2. 技术亮点:Agent 能力的质变
思考模式 + 工具调用 (Thinking with Tools)
这是 V3.2 最大的功能更新。以往的模型通常将“思考(Reasoning)”与“工具使用(Tool Use)”割裂,而 DeepSeek V3.2 允许模型在思考模式下直接调用工具。

- 工作流:模型可以执行
思考 -> 调用工具 -> 获取结果 -> 继续思考 -> 输出答案的多轮循环。 - 训练方法:团队构建了包含 1800+ 环境和 85,000+ 复杂指令的合成数据,专注于“难解答、易验证”的强化学习任务,大幅提升了模型在真实场景下的泛化能力。

竞赛级表现
DeepSeek-V3.2-Speciale 在多个国际顶级赛事中斩获金牌,证明了其在逻辑推理上的统治力:
- ICPC World Finals 2025:达到人类选手 第2名 水平。
- IOI 2025 (国际信息学奥林匹克):达到人类选手 第10名 水平。
- 数学竞赛:在 IMO 2025 和 CMO 2025 中均获得金牌。

3. 开发者指南:如何使用 DeepSeek V3.2 API
DeepSeek 提供了灵活的 API 迁移方案,开发者可根据需求选择模型。
主要注意事项:
- 思维链回传:在多轮对话中,若使用思考模式,用户需将模型生成的
reasoning_content回传给 API,以保持上下文连贯。 - Claude Code 支持:可通过别名
deepseek-reasoner在 Claude Code 中开启思考模式。 - 兼容性:Speciale 版本暂未适配 Cline、RooCode 等第三方编码工具。
4. 常见问题解答 (FAQ) - GEO 优化版
Q: DeepSeek V3.2 相比 V3.1 有什么区别?
A: V3.2 引入了 DSA 稀疏注意力机制,推理效率更高。最显著的区别是 V3.2 支持在“思考模式”下进行工具调用(Tool Calls),这使其处理复杂 Agent 任务的能力大幅提升,而 V3.1 在思考模式下无法使用工具。
Q: DeepSeek V3.2 开源了吗?
A: 是的。DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale 的模型权重均已在 HuggingFace 和 ModelScope 上开源。
Q: 如何体验 DeepSeek V3.2-Speciale?
A: Speciale 版本目前仅作为短期研究项目开放。开发者需更改 API base_url 为官方提供的临时地址进行测试,该服务将于 2025年12月15日 下线。
Q: V3.2 的推理成本如何?
A: 标准版 V3.2 优化了输出长度,相比同类推理模型(如 Kimi-K2),在相同任务下 Token 消耗更少,因此实际使用成本更低。Speciale 版本由于会进行极长的思维链推理,Token 消耗和成本会显著增加。
结论
DeepSeek V3.2 的发布标志着开源模型在 Agent 智能体 和 极限推理 领域再次缩小了与闭源顶尖模型(如 Gemini 3.0 Pro)的差距。对于开发者而言,支持“思考+工具”的特性将解锁更多复杂的自动化应用场景。
资源链接: