PrismML 推出 Bonsai Image 4B：开源画图模型，0.93GB 塞进 iPhone

Bonsai Image 4B：把 AI 画图塞进你的口袋

PrismML 是由加州理工学院团队创立的人工智能公司，总部位于加州帕萨迪纳。2026 年 5 月 26 日，PrismML 正式发布 Bonsai Image 4B——一个系列化的压缩图像生成模型家族，包含 1-bit（二值）和 Ternary（三值）两种变体，旨在让高质量扩散推理真正在本地设备上运行，从笔记本到手机无所不包。

这是同参数级别（4B）图像模型中，首次能够直接在 iPhone 上运行的作品。

核心技术：8.3 倍压缩，画质保留 95%

Bonsai Image 4B 基于 FLUX.2 Klein 4B（全精度 7.75 GB）进行极致压缩，通过 1-bit 和 Ternary 权重量化技术，将体积大幅缩减：

1-bit Bonsai Image 4B：扩散 Transformer 仅 0.93 GB，比全精度小 8.3 倍；生成 512×512 图像平均显存仅 1.5 GB（对比原版 11.74 GB），生成 1024×1024 图像平均显存 1.95 GB（对比原版 14.39 GB）
Ternary Bonsai Image 4B：使用 {-1, 0, +1} 三值权重，Transformer 仅 1.21 GB，比全精度小 6.4 倍；512×512 平均显存 1.96 GB，1024×1024 平均显存 2.38 GB

PrismML 官方表示，两个压缩版本均保留了原版高达 95% 的图像生成质量，精度敏感的支持层（约 5%）仍保留 FP16 格式以确保输出稳定。

速度对比：iPhone 17 Pro Max 约 9.4 秒出图

Bonsai Image 4B 在各平台上的出图速度令人印象深刻：

iPhone 17 Pro Max（Ternary MLX 版本）：512×512 约 9.4 秒/张
M4 Pro Mac（Ternary MLX 版本）：512×512 约 6 秒/张
RTX 3080（1-bit Gemlite 版本）：1024×1024 约 4.5 秒/张
A100 GPU（1-bit Gemlite 版本）：1024×1024 约 2.7 秒/张

作为对比，原始 FLUX.2 Klein 4B 全精度模型生成 512×512 图像需要约 11.74 GB 显存，根本无法在消费级硬件上运行。

开源生态：Hugging Face 已上线

Bonsai Image 4B 已在 Hugging Face 开源，提供了多个变体以适配不同平台：

prism-ml/bonsai-image-ternary-4B-mlx-2bit：macOS/iPhone/iPad（Apple Silicon）专用 MLX 版本，1.21 GB
prism-ml/bonsai-image-binary-4B-gemlite-1bit：NVIDIA GPU Linux/Windows 版本，0.93 GB

配套的 GitHub Demo（PrismML-Eng/Bonsai-image-demo）提供了 setup.sh / setup.ps1 一键启动脚本，内置 FastAPI 后端 + Next.js 前端，可在本地快速体验。

为什么这值得关注？

过去一年，AI 图像生成领域的竞争焦点集中在云端模型的能力上限（Midjourney v7、FLUX 2.0 等），但本地化、高效率的压缩路线始终缺乏重量级作品。Bonsai Image 4B 的出现填补了这一空白——它证明了在保持 95% 画质的同时，将 7.75 GB 的模型压缩到 1 GB 以下、在手机上跑出可用的出图速度，完全是可行的。

更重要的是，PrismML 的技术路径代表了一种范式转换：不是更大的模型，而是更高效的模型。他们提出的”intelligence density”（智能密度）概念——即每 bit 算力产生的智能——而非单纯追求参数规模，正在为端侧 AI 图像生成打开一扇新的大门。

本文经 fluxbbs.com 发布，记录 AI 行业重要开源模型发布。