Bonsai Image 4B:把 AI 画图塞进你的口袋
PrismML 是由加州理工学院团队创立的人工智能公司,总部位于加州帕萨迪纳。2026 年 5 月 26 日,PrismML 正式发布 Bonsai Image 4B——一个系列化的压缩图像生成模型家族,包含 1-bit(二值)和 Ternary(三值)两种变体,旨在让高质量扩散推理真正在本地设备上运行,从笔记本到手机无所不包。
这是同参数级别(4B)图像模型中,首次能够直接在 iPhone 上运行的作品。
核心技术:8.3 倍压缩,画质保留 95%
Bonsai Image 4B 基于 FLUX.2 Klein 4B(全精度 7.75 GB)进行极致压缩,通过 1-bit 和 Ternary 权重量化技术,将体积大幅缩减:
- 1-bit Bonsai Image 4B:扩散 Transformer 仅 0.93 GB,比全精度小 8.3 倍;生成 512×512 图像平均显存仅 1.5 GB(对比原版 11.74 GB),生成 1024×1024 图像平均显存 1.95 GB(对比原版 14.39 GB)
- Ternary Bonsai Image 4B:使用 {-1, 0, +1} 三值权重,Transformer 仅 1.21 GB,比全精度小 6.4 倍;512×512 平均显存 1.96 GB,1024×1024 平均显存 2.38 GB
PrismML 官方表示,两个压缩版本均保留了原版高达 95% 的图像生成质量,精度敏感的支持层(约 5%)仍保留 FP16 格式以确保输出稳定。
速度对比:iPhone 17 Pro Max 约 9.4 秒出图
Bonsai Image 4B 在各平台上的出图速度令人印象深刻:
- iPhone 17 Pro Max(Ternary MLX 版本):512×512 约 9.4 秒/张
- M4 Pro Mac(Ternary MLX 版本):512×512 约 6 秒/张
- RTX 3080(1-bit Gemlite 版本):1024×1024 约 4.5 秒/张
- A100 GPU(1-bit Gemlite 版本):1024×1024 约 2.7 秒/张
作为对比,原始 FLUX.2 Klein 4B 全精度模型生成 512×512 图像需要约 11.74 GB 显存,根本无法在消费级硬件上运行。
开源生态:Hugging Face 已上线
Bonsai Image 4B 已在 Hugging Face 开源,提供了多个变体以适配不同平台:
- prism-ml/bonsai-image-ternary-4B-mlx-2bit:macOS/iPhone/iPad(Apple Silicon)专用 MLX 版本,1.21 GB
- prism-ml/bonsai-image-binary-4B-gemlite-1bit:NVIDIA GPU Linux/Windows 版本,0.93 GB
配套的 GitHub Demo(PrismML-Eng/Bonsai-image-demo)提供了 setup.sh / setup.ps1 一键启动脚本,内置 FastAPI 后端 + Next.js 前端,可在本地快速体验。
为什么这值得关注?
过去一年,AI 图像生成领域的竞争焦点集中在云端模型的能力上限(Midjourney v7、FLUX 2.0 等),但本地化、高效率的压缩路线始终缺乏重量级作品。Bonsai Image 4B 的出现填补了这一空白——它证明了在保持 95% 画质的同时,将 7.75 GB 的模型压缩到 1 GB 以下、在手机上跑出可用的出图速度,完全是可行的。
更重要的是,PrismML 的技术路径代表了一种范式转换:不是更大的模型,而是更高效的模型。他们提出的”intelligence density”(智能密度)概念——即每 bit 算力产生的智能——而非单纯追求参数规模,正在为端侧 AI 图像生成打开一扇新的大门。
本文经 fluxbbs.com 发布,记录 AI 行业重要开源模型发布。