Flux AI 中文社区 - Flux.1 模型教程、资源下载与自学指南

11 19,2025 资讯

2 Views

谷歌发布Gemini 3：百万级上下文与全链路 Agent 引领 AI 新纪元

2025年11月19日，北京时间凌晨，Alphabet旗下的谷歌通过官方博客发布了全新的Gemini 3系列模型，取代了此前的2.5版本。本次发布通过一篇博客文介绍，没有举办隆重发布会，但仍然引发了技术圈的广泛关注。根据InfoQ等媒体的报道，Gemini 3被称为谷歌迄今为止“最智能、适应性最强”的模型。它针对现实世界的复杂问题进行了优化，特别适合需要高级推理、创造力、战略规划、长文本和多模态理解的应用。官方称...

11 08,2025 资讯

6 Views

AI视频像素级角色与物品参考：BindWeave模型与ComfyUI部署实测

AI视频像素级角色与物品参考：BindWeave模型与ComfyUI部署实测最近，来自AIwood爱屋研究室的视频展示了如何借助字节开源的 BindWeave 模型，在 ComfyUI 环境下实现像素级的角色与物品参考。这项技术不仅可以让 AI 在视频中准确复现角色的细节，还能同步控制多角色或角色与物品之间的互动，为视频生成带来了更高的一致性和自然感。 BindWeave模型的亮点统一的主体一致性框架：BindWeave 方案实际上是为了...

11 07,2025 资讯

2 Views

谷歌Gemini平台将推出Nano Banana2，图像生成效率与风格多样性升级

业界最新消息显示，谷歌正准备发布新一代 AI 图像生成模型 Nano Banana2（内部代号 GEMPIX2）。Gemini 官网的公告指出，这款模型预言将在数周内正式推出，这意味着谷歌在生成式 AI 领域的创新速度不断加快，方向为用户带来更加高效且精确的视觉创作体验。作为 DeepMind 团队的核心产品，Nano Banana 系列自 2025 年 8 月 26 日推出首代产品（官方名称为 Gemini 2.5 Flash Image）以来，以卓越的图像编辑...

11 05,2025 资讯

2 Views

重磅发布：MiniMax M2 开源模型 —— 低成本高性能新时代

## 引言 2025 年10 月，中国初创公司 MiniMax 正式开源并推出其新一代文本大模型 MiniMax‑M2。这款模型定位为 “代码原生” 和 “智能体原生”，主打高性能与低成本，为开发者和企业提供面向编码、代理任务的成熟方案。本文将梳理其核心特点、技术架构、价格优势以及潜在应用价值。 ### 核心亮点 – 开放开源、企业友好许可：MiniMax‑M2 在官网宣布对外开源，并以 MIT 许可提供。 – 顶尖性能与全球...

11 05,2025 未分类

3 Views

OpenAI’s Sora Video App Launches on Android, Expanding Global Footprint

In a significant move to broaden its user base, OpenAI has released its acclaimed AI video generation application, Sora, for the Android operating system. This launch marks a strategic expansion into the global short-form video creation market. The application is now accessible via the Google Play Store for users in several key countries, including the United States, Canada,...

11 04,2025 AI简讯

0 Views

字节跳动发布Ouro模型：将推理能力构建到预训练阶段

Ouro 是字节跳动 Seed 团队联合多家机构推出的循环语言模型（Looped Language Models）项目，旨在将推理能力直接构建到预训练阶段，而非依赖训练后的 “思维链” 等显式文本生成过程。该项目包含 Ouro-1.4B、Ouro-1.4B-Thinking、Ouro-2.6B、Ouro-2.6B-Thinking 等多类预训练模型，核心采用共享权重层堆栈的循环架构，集成学习到的 “退出门” 实现自适应计算 —— 简单输入可提前退出以节省资源，复杂输入则分配...

11 04,2025 未分类

3 Views

开源大模型SOTA又刷新！中国MiniMax M2全球排名第五，开源榜

中国AI独角兽之一，MiniMax发布了专为智能体和代码任务设计的模型M2，刷新开源SOTA。价格仅有Claude Sonnet的8%，速度超越近两倍。 MiniMax最知名的就是它们家的海螺AI，时不时就刷新视频生成、语音生成新高度。存在感爆棚。成立三年，MiniMax迅速发展，完成了多轮融资，在2023年6月就获得了超过2.5亿美元的投资。在M2之前，MiniMax已经推出了MiniMax-M1系列模型。 MiniMax-M1上线表现优异，超越了DeepS...

11 03,2025 资讯

4 Views

开源AI新浪潮：十月风云变幻，模型竞赛进入“效率为王”新阶段

# 开源AI新浪潮：十月风云变幻，模型竞赛进入“效率为王”新阶段 **2025年11月3日** – 刚刚过去的十月，全球开源人工智能领域经历了一场深刻的变革。竞争的焦点正从单纯的参数规模竞赛，转向对模型效率、专业能力和应用成本的全面考量。一系列重量级模型的发布和技术趋势的演进，标志着开源AI正式进入“效率为王”的新篇章。 — ### **核心看点：新模型与新趋势** #### **1. Mistral AI 再掀波澜：M...

10 28,2025 资讯

2 Views

近一周开源模型动态汇总（2025年10月21日–28日）

近一周开源模型动态汇总（2025年10月21日–28日）本周开源模型领域的动态非常丰富，以下是几件值得关注的大事： MiniMax 发布新一代开源文本大模型 M2 MiniMax（稀宇极智）在 10 月 27 日正式发布并开源新一代文本大模型 MiniMax‑M2。在全球权威评测榜单 Artificial Analysis（AA）中，这一模型总分进入全球前五，并成为榜单上的开源第一。 M2 采用混合专家（MoE）架构，总参数约 2300 亿，但在推理时只激...

10 26,2025 资讯

3 Views

LTX‑2 模型发布：开源同步音视频生成引擎

LTX‑2 模型发布：开源同步音视频生成引擎 10 月 23 日，AI 视频技术公司 Lightricks 宣布推出新一代开源视频生成模型 LTX ‑2。这款模型在音视频同步和 4K 生成上取得了重大突破，是其上一代模型 LTXV 0.9.8 的重要升级。LTX ‑2 将视听生成合并到一次流程中，并开放了架构和代码，鼓励开发者在其基础上二次开发 (ltx.video) 。主要亮点音频与视频同步生成：LTX ‑2 在一个统一的流程中同时生成画面与声音...