微软发布Mico:新一代 AI 伙伴,Clippy 以全新面貌回归

在本周的 Copilot 秋季发布会上,微软发布了全新的 AI 虚拟形象 Mico,这是公司在消费者端推进拟人化 AI 的最新尝试。Mico 的名字来自 “Microsoft Co…

通义千问发布新一代语音识别模型Qwen3‑ASR‑Flash:支持多语言与方言的高精度识别

近日,阿里旗下通义千问团队推出了新一代语音识别模型Qwen3‑ASR‑Flash。该模型以Qwen3为底座,结合了千万小时级别的多模态与语音识别数据,在识别精度和鲁棒性上显著提升,…

DeepSeek 发布 DeepSeek-V3.1-Terminus:优化语言一致性,强化 Agent 能力

2025年 9月 22 日,DeepSeek 正式发布其开源大语言模型的最新更新版——DeepSeek-V3.1-Terminus。该版本在前代 V3.1 的基础上,结合用户反馈进…

AI 资讯周报(2025年10月17-24日):倡议与合作、产品更新、科学突破与安全

AI 资讯周报(2025年10月17-24日) 在过去的一周里,全球的 AI 动态不断,既有社会倡议,也有商业合作、产品更新、科学突破以及安全警示。以下是本周值得关注的要点: 全球…

Nano Banana 官方提示词指南

Gemini 可以通过对话方式生成和处理图片。你可以通过文字、图片或两者结合的方式向 Gemini 发出提示,从而以前所未有的控制力来创建、修改和迭代视觉内容: Text-to-I…

完美继承与突破:Flux Dev 生态与Flux Krea模型发布

一、Flux Dev生态的优势 Flux作为Julia语言生态下的主力深度学习框架,拥有丰富的模型库和工具集,涵盖了计算机视觉、自然语言处理、强化学习、图神经网络、时间序列等多个领…

黑森林正式发布 FLUX.1 Kontext [dev] 公测版

要点: Black Forest Labs 今日宣布,开放邀请数月后,FLUX.1 Kontext [dev] 模型已全面进入公测阶段。 官方网站现可「一键体验」Kontext […

Flux Kontext:释放AI创意力的新一代生成引擎

在生成式AI领域快速发展的今天,创作者与开发者不断寻找更强大、更高效的工具,以突破创意与性能的双重边界。Flux Kontext,由 Black Forest Labs 推出,是一…

【AI短讯】苹果开源视觉模型 FastVLM

苹果正式发布 FastVLM 开源视觉模型,专为 iPhone、IPad 设备优化的高速视觉模型,强调能以极低的延迟完成图文理解任务,并实现与大语言模型 GPT 和 Qwen 高度…

Insert Anything: 开源图像无缝插入编辑框架

浙江大学、哈佛大学、南洋理工大学联合提出了统一的图像插入框架Insert Anything,支持多种实际场景,包括艺术创作、逼真的脸部交换、电影场景构图、虚拟服装试穿、配饰定制和数…

加载更多