AI 短讯

【AI短讯】苹果开源视觉模型 FastVLM

苹果正式发布 FastVLM 开源视觉模型,专为 iPhone、IPad 设备优化的高速视觉模型,强调能以极低的延迟完成图文理解任务,并实现与大语言模型 GPT 和 Qwen 高度整合。 FastVLM的主要功能是将高解析图像实时转换为语言模型可处理的视觉token,让设备得以在本地直接进行图像描述、问答分析等任务,无需仰赖云端资源或高耗能硬件。架构包含轻量级视觉主干FastViTHD,以及可与开源语言模型搭配的解码器...

【AI短讯】苹果开源视觉模型 FastVLM【AI短讯】苹果开源视觉模型 FastVLM

read more..

【AI短讯】Midjourney V7再升级

2025年5月3日,Midjourney V7 推出实验性模式。这是V7模型的加速版本,发布默认快速模式,成本降为之前一半,与V6作业价格大致相同。快速模式下作业约40秒,turbo模式18秒。质量方面,新手部有轻微改进,想要旧版本可用–q 2获取,还新增“实验性”–q 4模式,或有更好连贯性和细节。需注意,–oref作业成本仍是正常fast模式2倍,草稿模式无变化。

【AI短讯】Midjourney V7再升级

read more..

【AI 短讯】小米开源推理大模型 Xiaomi MiMo

模型简介Xiaomi MiMo 是小米推出的首个开源推理大语言模型,参数规模为 7B(70 亿),聚焦数学推理与代码生成任务。通过高推理密度的预训练数据(总计 25 万亿 tokens)及强化学习算法优化,该模型在 7B 参数规模下实现了推理能力的突破性提升,技术报告显示其性能超越了 OpenAI o1-mini 和阿里等竞品模型 。小米团队通过联动预训练与后训练阶段的数据和算法创新(如挖掘富推理语料、合成 200B tokens 推...

【AI 短讯】小米开源推理大模型 Xiaomi MiMo

read more..

阿里通义Qwen3发布:重新定义开源AI的里程碑

技术突破:混合推理架构的革新 在AI演进的浪潮中,阿里通义实验室推出的Qwen3系列以”混合推理架构”开辟了新路径。这一创新通过动态调配计算资源,实现了基础模型与扩展功能的分离式处理。具体表现为: 双模运行:基础模型处理通用任务,扩展能力模块通过API调用实现功能升级 资源弹性:根据实际需求动态分配GPU集群,使高参数模型的部署成本降至传统方案的35% 架构创新...

阿里通义Qwen3发布:重新定义开源AI的里程碑

read more..