Flux1.1 pro A digital illustration with a playful and whimsical style, featuring a graphic design with a variety of cartoon-like characters and shapes. The image is a flat illustration with bold lines and simple shapes that evoke a sense of fun and creativity. The style is reminiscent of a modern, graphic design with a focus on bold outlines and a limited color palette, whi...

read more..

黑森林正式发布 FLUX.1 Kontext [dev] 公测版

要点: Black Forest Labs 今日宣布,开放邀请数月后,FLUX.1 Kontext [dev] 模型已全面进入公测阶段。 官方网站现可「一键体验」Kontext [dev],用户无需额外邀请即可试用在线 Demo。 同步在 Hugging Face 发布,模型以非商业许可(v1.1)提供下载与 API 调用,社区点赞数突破300。 Kontext [dev] 采用 12B 参数扩散 Transformer 架构,支持原位图像生成与编辑,示例创作效果令人惊艳。...

黑森林正式发布 FLUX.1 Kontext [dev] 公测版

read more..

Flux Kontext:释放AI创意力的新一代生成引擎

在生成式AI领域快速发展的今天,创作者与开发者不断寻找更强大、更高效的工具,以突破创意与性能的双重边界。Flux Kontext,由 Black Forest Labs 推出,是一款旨在推动图像生成体验革新的新一代模型框架。 什么是 Flux Kontext? Flux Kontext 是一个高度模块化、可扩展的生成引擎框架,专为 AI 视觉创作而生。它在底层架构上优化了图像生成流程,支持多模态输入(如文本+图像)、多阶段生成、...

Flux Kontext:释放AI创意力的新一代生成引擎

read more..

【AI短讯】苹果开源视觉模型 FastVLM

苹果正式发布 FastVLM 开源视觉模型,专为 iPhone、IPad 设备优化的高速视觉模型,强调能以极低的延迟完成图文理解任务,并实现与大语言模型 GPT 和 Qwen 高度整合。 FastVLM的主要功能是将高解析图像实时转换为语言模型可处理的视觉token,让设备得以在本地直接进行图像描述、问答分析等任务,无需仰赖云端资源或高耗能硬件。架构包含轻量级视觉主干FastViTHD,以及可与开源语言模型搭配的解码器...

【AI短讯】苹果开源视觉模型 FastVLM【AI短讯】苹果开源视觉模型 FastVLM

read more..

Insert Anything: 开源图像无缝插入编辑框架

浙江大学、哈佛大学、南洋理工大学联合提出了统一的图像插入框架Insert Anything,支持多种实际场景,包括艺术创作、逼真的脸部交换、电影场景构图、虚拟服装试穿、配饰定制和数字道具更换,下图展示了其在各种图像编辑任务中的多功能性和有效性。 效果展示 相关链接 论文:https://arxiv.org/pdf/2504.15009 主页:https://song-wensong.github.io/insert-anything 结论 Ins...

Insert Anything: 开源图像无缝插入编辑框架

read more..

【AI短讯】Midjourney V7再升级

2025年5月3日,Midjourney V7 推出实验性模式。这是V7模型的加速版本,发布默认快速模式,成本降为之前一半,与V6作业价格大致相同。快速模式下作业约40秒,turbo模式18秒。质量方面,新手部有轻微改进,想要旧版本可用–q 2获取,还新增“实验性”–q 4模式,或有更好连贯性和细节。需注意,–oref作业成本仍是正常fast模式2倍,草稿模式无变化。

【AI短讯】Midjourney V7再升级

read more..

【AI 短讯】小米开源推理大模型 Xiaomi MiMo

模型简介Xiaomi MiMo 是小米推出的首个开源推理大语言模型,参数规模为 7B(70 亿),聚焦数学推理与代码生成任务。通过高推理密度的预训练数据(总计 25 万亿 tokens)及强化学习算法优化,该模型在 7B 参数规模下实现了推理能力的突破性提升,技术报告显示其性能超越了 OpenAI o1-mini 和阿里等竞品模型 。小米团队通过联动预训练与后训练阶段的数据和算法创新(如挖掘富推理语料、合成 200B tokens 推...

【AI 短讯】小米开源推理大模型 Xiaomi MiMo

read more..

Midjourney新功能Omni:解锁AI图像生成新境界

一、引言 在AI图像生成领域,Midjourney一直是备受瞩目的佼佼者。近期,Midjourney推出了一项名为“Omni – Reference”(全向参考)的革命性新功能,为创作者们带来了前所未有的创作自由和精准控制,让AI绘画真正实现了“想啥画啥”的创意愿景。本文将详细介绍Midjourney Omni的功能特点、使用教程以及应用场景等内容,帮助大家快速掌握这一强大的新工具。 二、Omni – Reference功能介...

Midjourney新功能Omni:解锁AI图像生成新境界

read more..

阿里通义Qwen3发布:重新定义开源AI的里程碑

技术突破:混合推理架构的革新 在AI演进的浪潮中,阿里通义实验室推出的Qwen3系列以”混合推理架构”开辟了新路径。这一创新通过动态调配计算资源,实现了基础模型与扩展功能的分离式处理。具体表现为: 双模运行:基础模型处理通用任务,扩展能力模块通过API调用实现功能升级 资源弹性:根据实际需求动态分配GPU集群,使高参数模型的部署成本降至传统方案的35% 架构创新...

阿里通义Qwen3发布:重新定义开源AI的里程碑

read more..