谷歌发布Gemini 3:百万级上下文与全链路 Agent 引领 AI 新纪元

2025-11-19 26 0

2025年11月19日,北京时间凌晨,Alphabet旗下的谷歌通过官方博客发布了全新的Gemini 3系列模型,取代了此前的2.5版本。本次发布通过一篇博客文介绍,没有举办隆重发布会,但仍然引发了技术圈的广泛关注。

根据InfoQ等媒体的报道,Gemini 3被称为谷歌迄今为止“最智能、适应性最强”的模型。它针对现实世界的复杂问题进行了优化,特别适合需要高级推理、创造力、战略规划、长文本和多模态理解的应用。官方称其上下文窗口高达百万级,可以同时处理约150万英文单词或数千行代码,这为科研、编程和内容创作等复杂场景提供了新的可能。

与上一代相比,Gemini 3最大的变化是引入了完整的Agent工作流程。新的“Gemini Agent”功能允许模型主动执行任务,例如整理电子邮件、搜索并预订行程甚至生成完整的应用程序流程。InfoQ指出,这种全链路的智能体能力为自动化和个人助手场景奠定了基础。

The Verge在报道中强调,Gemini 3 Pro是一个“原生多模态”模型,它能够同时处理文本、图片和音频,而不再把这些输入拆分为独立流程。用户可以将多张菜谱照片上传,Gemini 3会把它们整理成一本电子食谱;也可以根据一段视频讲座自动生成交互式抽认卡。与此同时,谷歌还推出了“动态视图”和“生成式界面”等新功能,为搜索和应用体验注入了更丰富的视觉元素和交互方式。

在搜索产品中,Gemini 3通过升级的“查询扇出技术”提升了信息检索能力,更好理解用户意图并发现先前可能遗漏的内容。谷歌高管Tulsee Doshi表示,这一举措让公司更接近“让信息普遍可得并真正有用”的目标。在用户体验上,新的模型回答更为简洁直接,避免无谓的奉承,这也是对OpenAI ChatGPT早期“谄媚”问题的回应。

Gemini 3系列在各类基准测试中也表现亮眼。在广受关注的LMArena排行榜上,Gemini 3 Pro以1501 Elo的高分登顶;在数学推理、科学推理和多模态理解等多个子榜单上均刷新纪录。谷歌还为特定用户开放了“Deep Think”模式,进一步提升复杂问题上的推理能力。

此次发布不仅面向普通用户,开发者也能通过Gemini应用、AI Studio和Vertex AI使用这一模型。谷歌在官方博客中表示,未来还会推出更多专用模型,并提供包括“低思考”在内的不同推理等级,帮助用户在效率与能力之间找到平衡。

业内分析认为,Gemini 3的推出是谷歌在生成式AI竞争中的重要一步。在OpenAI GPT-5发布表现不佳的背景下,Gemini 3展示的强大推理和多模态能力有望帮助谷歌在消费者市场和企业市场取得领先。随着更智能的Agent模式和长文本处理能力的成熟,AI助手的应用场景将更加丰富,未来几个月值得持续关注。

相关文章

AI视频像素级角色与物品参考:BindWeave模型与ComfyUI部署实测
谷歌Gemini平台将推出Nano Banana2,图像生成效率与风格多样性升级
重磅发布:MiniMax M2 开源模型 —— 低成本高性能新时代
开源AI新浪潮:十月风云变幻,模型竞赛进入“效率为王”新阶段
近一周开源模型动态汇总(2025年10月21日–28日)
LTX‑2 模型发布:开源同步音视频生成引擎