AI 短讯 – AI 自学笔记

05 16,2025 AI 短讯

12 Views

【AI短讯】苹果开源视觉模型 FastVLM

苹果正式发布 FastVLM 开源视觉模型，专为 iPhone、IPad 设备优化的高速视觉模型，强调能以极低的延迟完成图文理解任务，并实现与大语言模型 GPT 和 Qwen 高度整合。 FastVLM的主要功能是将高解析图像实时转换为语言模型可处理的视觉token，让设备得以在本地直接进行图像描述、问答分析等任务，无需仰赖云端资源或高耗能硬件。架构包含轻量级视觉主干FastViTHD，以及可与开源语言模型搭配的解码器...

05 07,2025 AI 短讯

1 Views

【AI短讯】Midjourney V7再升级

2025年5月3日，Midjourney V7 推出实验性模式。这是V7模型的加速版本，发布默认快速模式，成本降为之前一半，与V6作业价格大致相同。快速模式下作业约40秒，turbo模式18秒。质量方面，新手部有轻微改进，想要旧版本可用–q 2获取，还新增“实验性”–q 4模式，或有更好连贯性和细节。需注意，–oref作业成本仍是正常fast模式2倍，草稿模式无变化。

05 05,2025 AI 短讯

3 Views

【AI 短讯】小米开源推理大模型 Xiaomi MiMo

模型简介Xiaomi MiMo 是小米推出的首个开源推理大语言模型，参数规模为 7B（70 亿），聚焦数学推理与代码生成任务。通过高推理密度的预训练数据（总计 25 万亿 tokens）及强化学习算法优化，该模型在 7B 参数规模下实现了推理能力的突破性提升，技术报告显示其性能超越了 OpenAI o1-mini 和阿里等竞品模型。小米团队通过联动预训练与后训练阶段的数据和算法创新（如挖掘富推理语料、合成 200B tokens 推...

05 05,2025 AI 短讯

6 Views

【AI 短讯】开源AI上色模型 Cobra 发布！

Cobra 可为线稿漫画自动上色，并支持多角色参考，助力漫画创作更高效。项目地址：官网｜ GitHub 我们可以用这种工具，进行一些漫画的创作，特别适合哪些想要创作漫画的小伙伴。

04 29,2025 AI 短讯

3 Views

阿里通义Qwen3发布：重新定义开源AI的里程碑

技术突破：混合推理架构的革新在AI演进的浪潮中，阿里通义实验室推出的Qwen3系列以”混合推理架构”开辟了新路径。这一创新通过动态调配计算资源，实现了基础模型与扩展功能的分离式处理。具体表现为：双模运行：基础模型处理通用任务，扩展能力模块通过API调用实现功能升级资源弹性：根据实际需求动态分配GPU集群，使高参数模型的部署成本降至传统方案的35% 架构创新...