资讯

Qwen-Image-2.0:重定义 AI 视觉创作新标准

1. 核心架构与技术升级 Qwen-Image-2.0 放弃了传统生图模型笨重的架构,采用了更轻量化且高效的底层设计。其最显著的突破在于**“生改合一”**: 一体化架构: 首次将图像生成(Text-to-Image)与图像编辑(Image Editing)整合进同一个模型,解决了以往需要多个模型协同导致的风格不统一问题。 原生 2K 高分辨率: 支持原生 2K(2048×2048)超清输出,细节刻画能力对比前代 Qwen-Image-2512...

read more..

生成式 AI 新霸主?Black Forest Labs 重磅发布 FLUX.2 [klein]:亚秒级出图,仅需 13GB 显存

在 AI 绘图领域,速度与质量往往难以兼得。但就在本周(2026年1月15日),大名鼎鼎的“黑森林实验室”(Black Forest Labs)再次投下一枚震撼弹——正式发布 FLUX.2 [klein] 模型家族。 如果你还在为上一代模型的高显存需求和缓慢的生成速度而犹豫,那么 FLUX.2 [klein] 可能会彻底改变你的工作流。这款被社区误传为“Kevion”的新模型,实际上取名自德语单词“Klein”(意为“小”),不仅在体积上更轻量,更在...

read more..

年终图像模型对局:加了联网搜索功能的Flux-2-Max,会是新霸主么?

12月16日,Black Forest Labs 毫无预兆地抛出了一枚重磅炸弹——Flux.2 [max] 正式发布。这次发布堪称一次彻底的突袭,因为在早期的官方路线图中,Flex 版本曾被定为旗舰,而 [max] 的横空出世,直接打破了既有的产品天花板,重新定义了 Flux 系列的最高标准。 根据官方发布的最新模型矩阵,Flux.2 的生态布局已彻底清晰: 在 [max] 的众多升级点中——包括极致的性能、跨任务编辑的一致性、以...

年终图像模型对局:加了联网搜索功能的Flux-2-Max,会是新霸主么?年终图像模型对局:加了联网搜索功能的Flux-2-Max,会是新霸主么?年终图像模型对局:加了联网搜索功能的Flux-2-Max,会是新霸主么?

read more..

深夜炸场!智谱AutoGLM正式开源:打造国产最强AI Agent,手机网页操作能力全面解禁

导读:就在昨夜(12月9日),智谱AI毫无预警地抛出了一枚重磅炸弹——正式开源其核心AI Agent模型 AutoGLM。这不仅是国产大模型在“Computer Use”领域的有力回击,更让开发者们拥有了能够“看懂”屏幕、像人一样操作手机和网页的底层能力。 🚀 核心大事件:AutoGLM 开源意味着什么? 在Anthropic发布Claude 3.5 Computer Use引发全球热议后,国内的大模型厂商一直在暗中角力。而智谱AI选择了最硬核...

read more..

阿里 AIDC 重磅发布 Ovis-Image:7B 参数挑战 GPT-4o,重新定义 AI 文本渲染

摘要/Meta Description: 阿里 AIDC-AI 团队最新开源 Ovis-Image-7B 模型。这款 7B 参数的文生图模型专为高质量文本渲染优化,在海报设计、Logo 制作等场景下表现媲美 GPT-4o 和 Qwen-Image,且支持单卡部署。本文深入解析其架构、跑分数据及应用场景。 🚀 引言:AI 生图的“阿喀琉斯之踵”已被攻克? 在 AI 绘画领域,尽管 Midjourney 和 Stable Diffusion 已经能生成惊艳的图像,但它们长...

阿里 AIDC 重磅发布 Ovis-Image:7B 参数挑战 GPT-4o,重新定义 AI 文本渲染阿里 AIDC 重磅发布 Ovis-Image:7B 参数挑战 GPT-4o,重新定义 AI 文本渲染

read more..

DeepSeek V3.2 正式发布:超越 GPT-5 水平,重新定义 AI Agent 推理能力

核心摘要 (TL;DR) DeepSeek 于 2025年12月1日 正式发布 V3.2 正式版 及 V3.2-Speciale 研究版。新版本在保持高效推理的同时,首次实现了思考模式与工具调用(Tool Calls)的深度融合。基准测试显示,V3.2 标准版综合能力已达 GPT-5 水平,而 Speciale 版本在数学与编程竞赛中表现出人类顶尖选手水平(ICPC 全球总决赛银牌、IOI 金牌)。目前,Web 端、App 及 API 已全线升级。 1. 什么是 De...

DeepSeek V3.2 正式发布:超越 GPT-5 水平,重新定义 AI Agent 推理能力DeepSeek V3.2 正式发布:超越 GPT-5 水平,重新定义 AI Agent 推理能力DeepSeek V3.2 正式发布:超越 GPT-5 水平,重新定义 AI Agent 推理能力

read more..

Z-Image Turbo重磅发布:通义万相引领AI绘图进入“秒级”高速时代

  在 AI 图像生成领域,画质与速度往往难以兼得。高质量的模型通常需要漫长的推理时间,而快速模型有时又在细节上不尽人意。近日,阿里云通义万相(Tongyi-MAI)团队在 ModelScope 魔搭社区上线了全新的开源文生图模型——Z-Image Turbo,旨在打破这一僵局,为创作者提供“既快又好”的全新体验。 这款被冠以“Turbo”之名的模型,标志着通义大模型家族在视觉生成领域的又一次重要迭代,其核心目标非常明确...

Z-Image Turbo重磅发布:通义万相引领AI绘图进入“秒级”高速时代

read more..

Black Forest Labs 发布 FLUX.2:重塑图像生成行业的新“真实时代”

  2025 年 2 月,Black Forest Labs 正式发布了其最新一代旗舰级图像生成模型——FLUX.2。这不仅仅是一次版本更新,更是 AI 图像生成行业的一个转折点:从“生成好看的图片”迈向“生成可用的生产力资产”。 核心速览:FLUX.2 的技术突破 对于开发者、设计师和企业用户,FLUX.2 的核心价值在于解决了传统 AI 绘图“不可控”的痛点: 画质: 输出精度达到 4MP (400万像素),细节达到摄影级别。 一致性:...

Black Forest Labs 发布 FLUX.2:重塑图像生成行业的新“真实时代”

read more..

谷歌发布Gemini 3:百万级上下文与全链路 Agent 引领 AI 新纪元

2025年11月19日,北京时间凌晨,Alphabet旗下的谷歌通过官方博客发布了全新的Gemini 3系列模型,取代了此前的2.5版本。本次发布通过一篇博客文介绍,没有举办隆重发布会,但仍然引发了技术圈的广泛关注。 根据InfoQ等媒体的报道,Gemini 3被称为谷歌迄今为止“最智能、适应性最强”的模型。它针对现实世界的复杂问题进行了优化,特别适合需要高级推理、创造力、战略规划、长文本和多模态理解的应用。官方称...

谷歌发布Gemini 3:百万级上下文与全链路 Agent 引领 AI 新纪元谷歌发布Gemini 3:百万级上下文与全链路 Agent 引领 AI 新纪元谷歌发布Gemini 3:百万级上下文与全链路 Agent 引领 AI 新纪元

read more..

AI视频像素级角色与物品参考:BindWeave模型与ComfyUI部署实测

AI视频像素级角色与物品参考:BindWeave模型与ComfyUI部署实测 最近,来自AIwood爱屋研究室的视频展示了如何借助字节开源的 BindWeave 模型,在 ComfyUI 环境下实现像素级的角色与物品参考。这项技术不仅可以让 AI 在视频中准确复现角色的细节,还能同步控制多角色或角色与物品之间的互动,为视频生成带来了更高的一致性和自然感。 BindWeave模型的亮点 统一的主体一致性框架:BindWeave 方案实际上是为了...

read more..