阿里发布Qwen3.6-Plus：国产编程模型能力登顶，逼近Claude系列|AI 自学笔记

4月2日，阿里巴巴正式发布千问新一代大语言模型Qwen3.6-Plus。这是千问3.6系列的首款模型，在编程能力和智能体能力上实现全面跃升，成为当下编程能力最强的国产大模型，部分性能已逼近全球顶尖的Claude系列。

核心能力：编程Agent登顶国产第一

Qwen3.6-Plus最引人注目的突破在于其编程Agent能力。在SWE-bench系列真实编程任务测试、Terminal-Bench 2.0长程编程评测、NL2Repo，以及Claw-Eval、QwenClawBench等真实世界Agent能力评测中，Qwen3.6-Plus的表现均可圈可点。

具体而言，Qwen3.6-Plus编程表现超越参数量为其2至3倍的GLM-5、Kimi-K2.5等国产主流模型，在Terminal-Bench 2.0评测中更是超越了Claude Opus 4.5，成为首个在该项评测中超越Claude的国产大模型。

100万Token上下文：仓库级任务一步到位

Qwen3.6-Plus默认提供100万Token上下文窗口，可一次性摄入约75万字文本或一整个大型代码仓库。这意味着开发者可以将整个代码库——包括所有依赖项、测试用例、文档和提交历史——在单一上下文窗口内完成理解和推理。

在实测场景中，千问3.6可自主拆解任务、规划执行路径、编写测试并迭代修复，直至目标达成。这种「氛围编程」（Vibe Coding）让自然语言驱动AI写代码成为现实。

多模态推理：视觉编程能力显著增强

Qwen3.6-Plus基于原生多模态数据训练，具备更敏锐的理解感知能力和更强大的多模态推理能力。在复杂文档理解、物理世界视觉理解、视频推理和视觉编程等任务上取得了稳定提升。

视觉编程是其多模态能力的一大亮点：模型可基于界面截图、设计稿或自然图文描述，直接完成前端页面生成、代码补全、交互修改等任务，从「看懂界面」到「生成代码」再到「调用工具完成修改」的完整链路已经打通。

生态深度整合：主流Agent框架全面适配

Qwen3.6-Plus集中对OpenClaw、Qwen Code、Claude Code、Kilo Code、Cline、OpenCode等系列Agent框架进行了优化支持。通过深度融合推理能力、海量上下文记忆与精准工具执行能力，模型在开放环境中完成复杂任务的新潜力得到释放。

应用场景：从开发到企业的全链路覆盖

在前端开发场景，用户仅需以自然语言描述需求，Qwen3.6-Plus即可自主完成从方案拆解、前后端代码编写、跨文件联调到最终测试验证的完整生命周期。在企业场景中，悟空等平台已率先接入，用户可体验从「副驾驶」到「协作者」的角色升级。

定价与可用性

Qwen3.6-Plus已上架阿里云百炼API，每百万Tokens输入最低2元；同时已登陆悟空、千问APP等阿里AI应用和平台。此外，千问3.6系列后续将开源其他尺寸模型，旗舰版Qwen3.6-Max也将于近期发布。

Qwen3.6-Plus的发布，标志着国产大模型在编程Agent赛道正式进入全球第一梯队，也为开发者和企业用户提供了一条高性能、高性价比的新选择。

阿里发布Qwen3.6-Plus：国产编程模型能力登顶，逼近Claude系列

📌 相关推荐