资讯 – 第 2 页 – AI 自学笔记

11 07,2025 资讯

0 Views

谷歌Gemini平台将推出Nano Banana2，图像生成效率与风格多样性升级

业界最新消息显示，谷歌正准备发布新一代 AI 图像生成模型 Nano Banana2（内部代号 GEMPIX2）。Gemini 官网的公告指出，这款模型预言将在数周内正式推出，这意味着谷歌在生成式 AI 领域的创新速度不断加快，方向为用户带来更加高效且精确的视觉创作体验。作为 DeepMind 团队的核心产品，Nano Banana 系列自 2025 年 8 月 26 日推出首代产品（官方名称为 Gemini 2.5 Flash Image）以来，以卓越的图像编辑...

11 05,2025 资讯

0 Views

重磅发布：MiniMax M2 开源模型 —— 低成本高性能新时代

## 引言 2025 年10 月，中国初创公司 MiniMax 正式开源并推出其新一代文本大模型 MiniMax‑M2。这款模型定位为 “代码原生” 和 “智能体原生”，主打高性能与低成本，为开发者和企业提供面向编码、代理任务的成熟方案。本文将梳理其核心特点、技术架构、价格优势以及潜在应用价值。 ### 核心亮点 – 开放开源、企业友好许可：MiniMax‑M2 在官网宣布对外开源，并以 MIT 许可提供。 – 顶尖性能与全球...

11 03,2025 资讯

0 Views

开源AI新浪潮：十月风云变幻，模型竞赛进入“效率为王”新阶段

# 开源AI新浪潮：十月风云变幻，模型竞赛进入“效率为王”新阶段 **2025年11月3日** – 刚刚过去的十月，全球开源人工智能领域经历了一场深刻的变革。竞争的焦点正从单纯的参数规模竞赛，转向对模型效率、专业能力和应用成本的全面考量。一系列重量级模型的发布和技术趋势的演进，标志着开源AI正式进入“效率为王”的新篇章。 — ### **核心看点：新模型与新趋势** #### **1. Mistral AI 再掀波澜：M...

10 28,2025 资讯

0 Views

近一周开源模型动态汇总（2025年10月21日–28日）

近一周开源模型动态汇总（2025年10月21日–28日）本周开源模型领域的动态非常丰富，以下是几件值得关注的大事： MiniMax 发布新一代开源文本大模型 M2 MiniMax（稀宇极智）在 10 月 27 日正式发布并开源新一代文本大模型 MiniMax‑M2。在全球权威评测榜单 Artificial Analysis（AA）中，这一模型总分进入全球前五，并成为榜单上的开源第一。 M2 采用混合专家（MoE）架构，总参数约 2300 亿，但在推理时只激...

10 26,2025 资讯

0 Views

LTX‑2 模型发布：开源同步音视频生成引擎

LTX‑2 模型发布：开源同步音视频生成引擎 10 月 23 日，AI 视频技术公司 Lightricks 宣布推出新一代开源视频生成模型 LTX ‑2。这款模型在音视频同步和 4K 生成上取得了重大突破，是其上一代模型 LTXV 0.9.8 的重要升级。LTX ‑2 将视听生成合并到一次流程中，并开放了架构和代码，鼓励开发者在其基础上二次开发 (ltx.video) 。主要亮点音频与视频同步生成：LTX ‑2 在一个统一的流程中同时生成画面与声音...

10 26,2025 资讯

0 Views

微软发布Mico：新一代 AI 伙伴，Clippy 以全新面貌回归

在本周的 Copilot 秋季发布会上，微软发布了全新的 AI 虚拟形象 Mico，这是公司在消费者端推进拟人化 AI 的最新尝试。Mico 的名字来自 “Microsoft Copilot”，它可以倾听用户、给出反应并通过变换颜色表达情绪，旨在打造一位温暖、可定制的数字伙伴。令人会心一笑的是，这款角色还暗藏了彩蛋：在 Copilot 语音界面中多次点击 Mico，它会“变身”成 20 多年前广受讨论的 Office 助手 Clippy，让经典角色以 AI ...

10 26,2025 资讯

0 Views

通义千问发布新一代语音识别模型Qwen3‑ASR‑Flash：支持多语言与方言的高精度识别

近日，阿里旗下通义千问团队推出了新一代语音识别模型Qwen3‑ASR‑Flash。该模型以Qwen3为底座，结合了千万小时级别的多模态与语音识别数据，在识别精度和鲁棒性上显著提升，支持11种语言及多种方言，在中英文及多语种基准测试中取得领先成绩。业内人士认为，新模型不仅强化了通义千问在语音领域的技术布局，也为多语种、多场景的语音转文字服务带来了新的可能。如果希望体验这一模型，可以通过以下入口： ...

10 26,2025 资讯

0 Views

DeepSeek 发布 DeepSeek-V3.1-Terminus：优化语言一致性，强化 Agent 能力

2025年 9月 22 日，DeepSeek 正式发布其开源大语言模型的最新更新版——DeepSeek-V3.1-Terminus。该版本在前代 V3.1 的基础上，结合用户反馈进行了深度优化，重点提升了语言一致性与智能体能力。据官方介绍，DeepSeek-V3.1-Terminus 同时提供思考模型与非思考模型，上下文窗口均为 128k，支持在线体验。输出长度方面，非思考模型默认 4K、最大 8K；思考模型默认 32K、最大 64K，以满足不同场景的需求。此次...

10 24,2025 未分类,资讯

0 Views

AI 资讯周报（2025年10月17-24日）：倡议与合作、产品更新、科学突破与安全

AI 资讯周报（2025年10月17-24日）在过去的一周里，全球的 AI 动态不断，既有社会倡议，也有商业合作、产品更新、科学突破以及安全警示。以下是本周值得关注的要点：全球科技与公共人物呼吁谨慎发展超级智能：超过 800 名公众人物（包括 AI 领域先驱 Geoffrey Hinton 和 Yoshua Bengio）联署公开信，呼吁在证明超级智能安全、可控并得到公众支持之前暂停相关开发 (www.harpersbazaar.com) 。英国哈里王...

08 01,2025 资讯

0 Views

完美继承与突破：Flux Dev 生态与Flux Krea模型发布

一、Flux Dev生态的优势 Flux作为Julia语言生态下的主力深度学习框架，拥有丰富的模型库和工具集，涵盖了计算机视觉、自然语言处理、强化学习、图神经网络、时间序列等多个领域。其开放、模块化和高性能的特性，为模型开发与创新提供了极大的便利。围绕Flux，Julia社区还发展出如FastAI.jl、ComfyUI等高阶训练与推理工具，让用户能够更灵活地构建和优化深度学习工作流。二、Flux Krea模型简介 ...