Insert Anything: 开源图像无缝插入编辑框架

2025-05-16 50 0

浙江大学、哈佛大学、南洋理工大学联合提出了统一的图像插入框架Insert Anything，支持多种实际场景，包括艺术创作、逼真的脸部交换、电影场景构图、虚拟服装试穿、配饰定制和数字道具更换，下图展示了其在各种图像编辑任务中的多功能性和有效性。

效果展示

相关链接

论文：https://arxiv.org/pdf/2504.15009
主页：https://song-wensong.github.io/insert-anything

结论

Insert Anything是一个基于参考的图像插入统一框架，它通过支持蒙版和文本引导控制，克服了专用方法的局限性，适用于各种插入任务。利用新开发的包含 12 万个提示图像对的 AnyInsertion 数据集以及 DiT 架构的功能实现了创新的上下文编辑机制，该机制采用双联画和三联画提示策略，能够有效地保留身份特征，同时保持插入元素与目标场景之间的视觉和谐。在三个基准测试上进行的大量实验表明，提出的方法在人物、物体和服装插入方面始终优于最先进的方法，为基于参考的图像编辑树立了新标杆，并为现实世界的创意应用提供了通用的解决方案。

darlingyc

Insert Anything图像编辑 资讯

0 0

【AI短讯】Midjourney V7再升级

【AI短讯】苹果开源视觉模型 FastVLM

完美继承与突破：Flux Dev 生态与Flux Krea模型发布

黑森林正式发布 FLUX.1 Kontext [dev] 公测版

Flux Kontext：释放AI创意力的新一代生成引擎

Midjourney新功能Omni：解锁AI图像生成新境界

Flux 加速节点TeaCache，生成速度提升两倍！

技术再突破，加速节点WaveSpeed让 Flux 生成速度狂飙十倍

发布评论取消回复

要发表评论，您必须先登录。