资讯

谷歌发布Gemini 3:百万级上下文与全链路 Agent 引领 AI 新纪元

2025年11月19日,北京时间凌晨,Alphabet旗下的谷歌通过官方博客发布了全新的Gemini 3系列模型,取代了此前的2.5版本。本次发布通过一篇博客文介绍,没有举办隆重发…

AI视频像素级角色与物品参考:BindWeave模型与ComfyUI部署实测

AI视频像素级角色与物品参考:BindWeave模型与ComfyUI部署实测 最近,来自AIwood爱屋研究室的视频展示了如何借助字节开源的 BindWeave 模型,在 Comf…

谷歌Gemini平台将推出Nano Banana2,图像生成效率与风格多样性升级

业界最新消息显示,谷歌正准备发布新一代 AI 图像生成模型 Nano Banana2(内部代号 GEMPIX2)。Gemini 官网的公告指出,这款模型预言将在数周内正式推出,这意…

重磅发布:MiniMax M2 开源模型 —— 低成本高性能新时代

## 引言 2025 年10 月,中国初创公司 MiniMax 正式开源并推出其新一代文本大模型 MiniMax‑M2。这款模型定位为 “代码原生” 和 “智能体原生”,主打高性能…

开源AI新浪潮:十月风云变幻,模型竞赛进入“效率为王”新阶段

# 开源AI新浪潮:十月风云变幻,模型竞赛进入“效率为王”新阶段 **2025年11月3日** - 刚刚过去的十月,全球开源人工智能领域经历了一场深刻的变革。竞争的焦点正从单纯的参…

近一周开源模型动态汇总(2025年10月21日–28日)

近一周开源模型动态汇总(2025年10月21日–28日) 本周开源模型领域的动态非常丰富,以下是几件值得关注的大事: MiniMax 发布新一代开源文本大模型 M2 MiniMax…

LTX‑2 模型发布:开源同步音视频生成引擎

LTX‑2 模型发布:开源同步音视频生成引擎 10 月 23 日,AI 视频技术公司 Lightricks 宣布推出新一代开源视频生成模型 LTX ‑2。这款模型在音视频同步和 4…

微软发布Mico:新一代 AI 伙伴,Clippy 以全新面貌回归

在本周的 Copilot 秋季发布会上,微软发布了全新的 AI 虚拟形象 Mico,这是公司在消费者端推进拟人化 AI 的最新尝试。Mico 的名字来自 “Microsoft Co…

通义千问发布新一代语音识别模型Qwen3‑ASR‑Flash:支持多语言与方言的高精度识别

近日,阿里旗下通义千问团队推出了新一代语音识别模型Qwen3‑ASR‑Flash。该模型以Qwen3为底座,结合了千万小时级别的多模态与语音识别数据,在识别精度和鲁棒性上显著提升,…

DeepSeek 发布 DeepSeek-V3.1-Terminus:优化语言一致性,强化 Agent 能力

2025年 9月 22 日,DeepSeek 正式发布其开源大语言模型的最新更新版——DeepSeek-V3.1-Terminus。该版本在前代 V3.1 的基础上,结合用户反馈进…

加载更多