阿里发布Qwen3.6-Plus:国产编程模型能力登顶,逼近Claude系列

2026-04-04 5 0

4月2日,阿里巴巴正式发布千问新一代大语言模型Qwen3.6-Plus。这是千问3.6系列的首款模型,在编程能力和智能体能力上实现全面跃升,成为当下编程能力最强的国产大模型,部分性能已逼近全球顶尖的Claude系列。

核心能力:编程Agent登顶国产第一

Qwen3.6-Plus最引人注目的突破在于其编程Agent能力。在SWE-bench系列真实编程任务测试、Terminal-Bench 2.0长程编程评测、NL2Repo,以及Claw-Eval、QwenClawBench等真实世界Agent能力评测中,Qwen3.6-Plus的表现均可圈可点。

具体而言,Qwen3.6-Plus编程表现超越参数量为其2至3倍的GLM-5、Kimi-K2.5等国产主流模型,在Terminal-Bench 2.0评测中更是超越了Claude Opus 4.5,成为首个在该项评测中超越Claude的国产大模型。

100万Token上下文:仓库级任务一步到位

Qwen3.6-Plus默认提供100万Token上下文窗口,可一次性摄入约75万字文本或一整个大型代码仓库。这意味着开发者可以将整个代码库——包括所有依赖项、测试用例、文档和提交历史——在单一上下文窗口内完成理解和推理。

在实测场景中,千问3.6可自主拆解任务、规划执行路径、编写测试并迭代修复,直至目标达成。这种「氛围编程」(Vibe Coding)让自然语言驱动AI写代码成为现实。

多模态推理:视觉编程能力显著增强

Qwen3.6-Plus基于原生多模态数据训练,具备更敏锐的理解感知能力和更强大的多模态推理能力。在复杂文档理解、物理世界视觉理解、视频推理和视觉编程等任务上取得了稳定提升。

视觉编程是其多模态能力的一大亮点:模型可基于界面截图、设计稿或自然图文描述,直接完成前端页面生成、代码补全、交互修改等任务,从「看懂界面」到「生成代码」再到「调用工具完成修改」的完整链路已经打通。

生态深度整合:主流Agent框架全面适配

Qwen3.6-Plus集中对OpenClaw、Qwen Code、Claude Code、Kilo Code、Cline、OpenCode等系列Agent框架进行了优化支持。通过深度融合推理能力、海量上下文记忆与精准工具执行能力,模型在开放环境中完成复杂任务的新潜力得到释放。

应用场景:从开发到企业的全链路覆盖

在前端开发场景,用户仅需以自然语言描述需求,Qwen3.6-Plus即可自主完成从方案拆解、前后端代码编写、跨文件联调到最终测试验证的完整生命周期。在企业场景中,悟空等平台已率先接入,用户可体验从「副驾驶」到「协作者」的角色升级。

定价与可用性

Qwen3.6-Plus已上架阿里云百炼API,每百万Tokens输入最低2元;同时已登陆悟空、千问APP等阿里AI应用和平台。此外,千问3.6系列后续将开源其他尺寸模型,旗舰版Qwen3.6-Max也将于近期发布。

Qwen3.6-Plus的发布,标志着国产大模型在编程Agent赛道正式进入全球第一梯队,也为开发者和企业用户提供了一条高性能、高性价比的新选择。

相关文章