谷歌发布Gemini 3:百万级上下文与全链路 Agent 引领 AI 新纪元

2025年11月19日,北京时间凌晨,Alphabet旗下的谷歌通过官方博客发布了全新的Gemini 3系列模型,取代了此前的2.5版本。本次发布通过一篇博客文介绍,没有举办隆重发布会,但仍然引发了技术圈的广泛关注。 根据InfoQ等媒体的报道,Gemini 3被称为谷歌迄今为止“最智能、适应性最强”的模型。它针对现实世界的复杂问题进行了优化,特别适合需要高级推理、创造力、战略规划、长文本和多模态理解的应用。官方称...

谷歌发布Gemini 3:百万级上下文与全链路 Agent 引领 AI 新纪元谷歌发布Gemini 3:百万级上下文与全链路 Agent 引领 AI 新纪元谷歌发布Gemini 3:百万级上下文与全链路 Agent 引领 AI 新纪元

read more..

AI视频像素级角色与物品参考:BindWeave模型与ComfyUI部署实测

AI视频像素级角色与物品参考:BindWeave模型与ComfyUI部署实测 最近,来自AIwood爱屋研究室的视频展示了如何借助字节开源的 BindWeave 模型,在 ComfyUI 环境下实现像素级的角色与物品参考。这项技术不仅可以让 AI 在视频中准确复现角色的细节,还能同步控制多角色或角色与物品之间的互动,为视频生成带来了更高的一致性和自然感。 BindWeave模型的亮点 统一的主体一致性框架:BindWeave 方案实际上是为了...

read more..

谷歌Gemini平台将推出Nano Banana2,图像生成效率与风格多样性升级

业界最新消息显示,谷歌正准备发布新一代 AI 图像生成模型 Nano Banana2(内部代号 GEMPIX2)。Gemini 官网的公告指出,这款模型预言将在数周内正式推出,这意味着谷歌在生成式 AI 领域的创新速度不断加快,方向为用户带来更加高效且精确的视觉创作体验。 作为 DeepMind 团队的核心产品,Nano Banana 系列自 2025 年 8 月 26 日推出首代产品(官方名称为 Gemini 2.5 Flash Image)以来,以卓越的图像编辑...

谷歌Gemini平台将推出Nano Banana2,图像生成效率与风格多样性升级

read more..

重磅发布:MiniMax M2 开源模型 —— 低成本高性能新时代

## 引言 2025 年10 月,中国初创公司 MiniMax 正式开源并推出其新一代文本大模型 MiniMax‑M2。这款模型定位为 “代码原生” 和 “智能体原生”,主打高性能与低成本,为开发者和企业提供面向编码、代理任务的成熟方案。本文将梳理其核心特点、技术架构、价格优势以及潜在应用价值。 ### 核心亮点 – 开放开源、企业友好许可:MiniMax‑M2 在官网宣布对外开源,并以 MIT 许可提供。 – 顶尖性能与全球...

read more..

OpenAI’s Sora Video App Launches on Android, Expanding Global Footprint

In a significant move to broaden its user base, OpenAI has released its acclaimed AI video generation application, Sora, for the Android operating system. This launch marks a strategic expansion into the global short-form video creation market. The application is now accessible via the Google Play Store for users in several key countries, including the United States, Canada,...

read more..

字节跳动发布Ouro模型:将推理能力构建到预训练阶段

Ouro 是字节跳动 Seed 团队联合多家机构推出的循环语言模型(Looped Language Models)项目,旨在将推理能力直接构建到预训练阶段,而非依赖训练后的 “思维链” 等显式文本生成过程。该项目包含 Ouro-1.4B、Ouro-1.4B-Thinking、Ouro-2.6B、Ouro-2.6B-Thinking 等多类预训练模型,核心采用共享权重层堆栈的循环架构,集成学习到的 “退出门” 实现自适应计算 —— 简单输入可提前退出以节省资源,复杂输入则分配...

read more..

开源大模型SOTA又刷新!中国MiniMax M2全球排名第五,开源榜

中国AI独角兽之一,MiniMax发布了专为智能体和代码任务设计的模型M2,刷新开源SOTA。 价格仅有Claude Sonnet的8%,速度超越近两倍。 MiniMax最知名的就是它们家的海螺AI,时不时就刷新视频生成、语音生成新高度。存在感爆棚。 成立三年,MiniMax迅速发展,完成了多轮融资,在2023年6月就获得了超过2.5亿美元的投资。 在M2之前,MiniMax已经推出了MiniMax-M1系列模型。 MiniMax-M1上线表现优异,超越了DeepS...

read more..

开源AI新浪潮:十月风云变幻,模型竞赛进入“效率为王”新阶段

# 开源AI新浪潮:十月风云变幻,模型竞赛进入“效率为王”新阶段 **2025年11月3日** – 刚刚过去的十月,全球开源人工智能领域经历了一场深刻的变革。竞争的焦点正从单纯的参数规模竞赛,转向对模型效率、专业能力和应用成本的全面考量。一系列重量级模型的发布和技术趋势的演进,标志着开源AI正式进入“效率为王”的新篇章。 — ### **核心看点:新模型与新趋势** #### **1. Mistral AI 再掀波澜:M...

read more..

近一周开源模型动态汇总(2025年10月21日–28日)

近一周开源模型动态汇总(2025年10月21日–28日) 本周开源模型领域的动态非常丰富,以下是几件值得关注的大事: MiniMax 发布新一代开源文本大模型 M2 MiniMax(稀宇极智)在 10 月 27 日正式发布并开源新一代文本大模型 MiniMax‑M2。在全球权威评测榜单 Artificial Analysis(AA)中,这一模型总分进入全球前五,并成为榜单上的开源第一。 M2 采用混合专家(MoE)架构,总参数约 2300 亿,但在推理时只激...

read more..

LTX‑2 模型发布:开源同步音视频生成引擎

LTX‑2 模型发布:开源同步音视频生成引擎 10 月 23 日,AI 视频技术公司 Lightricks 宣布推出新一代开源视频生成模型 LTX ‑2。这款模型在音视频同步和 4K 生成上取得了重大突破,是其上一代模型 LTXV 0.9.8 的重要升级。LTX ‑2 将视听生成合并到一次流程中,并开放了架构和代码,鼓励开发者在其基础上二次开发 (ltx.video) 。 主要亮点 音频与视频同步生成:LTX ‑2 在一个统一的流程中同时生成画面与声音...

read more..