资讯

谷歌Gemini平台将推出Nano Banana2,图像生成效率与风格多样性升级

业界最新消息显示,谷歌正准备发布新一代 AI 图像生成模型 Nano Banana2(内部代号 GEMPIX2)。Gemini 官网的公告指出,这款模型预言将在数周内正式推出,这意味着谷歌在生成式 AI 领域的创新速度不断加快,方向为用户带来更加高效且精确的视觉创作体验。 作为 DeepMind 团队的核心产品,Nano Banana 系列自 2025 年 8 月 26 日推出首代产品(官方名称为 Gemini 2.5 Flash Image)以来,以卓越的图像编辑...

谷歌Gemini平台将推出Nano Banana2,图像生成效率与风格多样性升级

read more..

重磅发布:MiniMax M2 开源模型 —— 低成本高性能新时代

## 引言 2025 年10 月,中国初创公司 MiniMax 正式开源并推出其新一代文本大模型 MiniMax‑M2。这款模型定位为 “代码原生” 和 “智能体原生”,主打高性能与低成本,为开发者和企业提供面向编码、代理任务的成熟方案。本文将梳理其核心特点、技术架构、价格优势以及潜在应用价值。 ### 核心亮点 – 开放开源、企业友好许可:MiniMax‑M2 在官网宣布对外开源,并以 MIT 许可提供。 – 顶尖性能与全球...

read more..

开源AI新浪潮:十月风云变幻,模型竞赛进入“效率为王”新阶段

# 开源AI新浪潮:十月风云变幻,模型竞赛进入“效率为王”新阶段 **2025年11月3日** – 刚刚过去的十月,全球开源人工智能领域经历了一场深刻的变革。竞争的焦点正从单纯的参数规模竞赛,转向对模型效率、专业能力和应用成本的全面考量。一系列重量级模型的发布和技术趋势的演进,标志着开源AI正式进入“效率为王”的新篇章。 — ### **核心看点:新模型与新趋势** #### **1. Mistral AI 再掀波澜:M...

read more..

近一周开源模型动态汇总(2025年10月21日–28日)

近一周开源模型动态汇总(2025年10月21日–28日) 本周开源模型领域的动态非常丰富,以下是几件值得关注的大事: MiniMax 发布新一代开源文本大模型 M2 MiniMax(稀宇极智)在 10 月 27 日正式发布并开源新一代文本大模型 MiniMax‑M2。在全球权威评测榜单 Artificial Analysis(AA)中,这一模型总分进入全球前五,并成为榜单上的开源第一。 M2 采用混合专家(MoE)架构,总参数约 2300 亿,但在推理时只激...

read more..

LTX‑2 模型发布:开源同步音视频生成引擎

LTX‑2 模型发布:开源同步音视频生成引擎 10 月 23 日,AI 视频技术公司 Lightricks 宣布推出新一代开源视频生成模型 LTX ‑2。这款模型在音视频同步和 4K 生成上取得了重大突破,是其上一代模型 LTXV 0.9.8 的重要升级。LTX ‑2 将视听生成合并到一次流程中,并开放了架构和代码,鼓励开发者在其基础上二次开发 (ltx.video) 。 主要亮点 音频与视频同步生成:LTX ‑2 在一个统一的流程中同时生成画面与声音...

read more..

微软发布Mico:新一代 AI 伙伴,Clippy 以全新面貌回归

在本周的 Copilot 秋季发布会上,微软发布了全新的 AI 虚拟形象 Mico,这是公司在消费者端推进拟人化 AI 的最新尝试。Mico 的名字来自 “Microsoft Copilot”,它可以倾听用户、给出反应并通过变换颜色表达情绪,旨在打造一位温暖、可定制的数字伙伴。 令人会心一笑的是,这款角色还暗藏了彩蛋:在 Copilot 语音界面中多次点击 Mico,它会“变身”成 20 多年前广受讨论的 Office 助手 Clippy,让经典角色以 AI ...

read more..

通义千问发布新一代语音识别模型Qwen3‑ASR‑Flash:支持多语言与方言的高精度识别

近日,阿里旗下通义千问团队推出了新一代语音识别模型Qwen3‑ASR‑Flash。该模型以Qwen3为底座,结合了千万小时级别的多模态与语音识别数据,在识别精度和鲁棒性上显著提升,支持11种语言及多种方言,在中英文及多语种基准测试中取得领先成绩。 业内人士认为,新模型不仅强化了通义千问在语音领域的技术布局,也为多语种、多场景的语音转文字服务带来了新的可能。 如果希望体验这一模型,可以通过以下入口: ...

read more..

DeepSeek 发布 DeepSeek-V3.1-Terminus:优化语言一致性,强化 Agent 能力

2025年 9月 22 日,DeepSeek 正式发布其开源大语言模型的最新更新版——DeepSeek-V3.1-Terminus。该版本在前代 V3.1 的基础上,结合用户反馈进行了深度优化,重点提升了语言一致性与智能体能力。 据官方介绍,DeepSeek-V3.1-Terminus 同时提供思考模型与非思考模型,上下文窗口均为 128k,支持在线体验。输出长度方面,非思考模型默认 4K、最大 8K;思考模型默认 32K、最大 64K,以满足不同场景的需求。 此次...

read more..

AI 资讯周报(2025年10月17-24日):倡议与合作、产品更新、科学突破与安全

AI 资讯周报(2025年10月17-24日) 在过去的一周里,全球的 AI 动态不断,既有社会倡议,也有商业合作、产品更新、科学突破以及安全警示。以下是本周值得关注的要点: 全球科技与公共人物呼吁谨慎发展超级智能:超过 800 名公众人物(包括 AI 领域先驱 Geoffrey Hinton 和 Yoshua Bengio)联署公开信,呼吁在证明超级智能安全、可控并得到公众支持之前暂停相关开发 (www.harpersbazaar.com) 。英国哈里王...

read more..

完美继承与突破:Flux Dev 生态与Flux Krea模型发布

一、Flux Dev生态的优势 Flux作为Julia语言生态下的主力深度学习框架,拥有丰富的模型库和工具集,涵盖了计算机视觉、自然语言处理、强化学习、图神经网络、时间序列等多个领域。其开放、模块化和高性能的特性,为模型开发与创新提供了极大的便利。围绕Flux,Julia社区还发展出如FastAI.jl、ComfyUI等高阶训练与推理工具,让用户能够更灵活地构建和优化深度学习工作流。 二、Flux Krea模型简介 ...

完美继承与突破:Flux Dev 生态与Flux Krea模型发布

read more..