在本周的 Copilot 秋季发布会上,微软发布了全新的 AI 虚拟形象 Mico,这是公司在消费者端推进拟人化 AI 的最新尝试。Mico 的名字来自 “Microsoft Co…
近日,阿里旗下通义千问团队推出了新一代语音识别模型Qwen3‑ASR‑Flash。该模型以Qwen3为底座,结合了千万小时级别的多模态与语音识别数据,在识别精度和鲁棒性上显著提升,…
2025年 9月 22 日,DeepSeek 正式发布其开源大语言模型的最新更新版——DeepSeek-V3.1-Terminus。该版本在前代 V3.1 的基础上,结合用户反馈进…
AI 资讯周报(2025年10月17-24日) 在过去的一周里,全球的 AI 动态不断,既有社会倡议,也有商业合作、产品更新、科学突破以及安全警示。以下是本周值得关注的要点: 全球…
Gemini 可以通过对话方式生成和处理图片。你可以通过文字、图片或两者结合的方式向 Gemini 发出提示,从而以前所未有的控制力来创建、修改和迭代视觉内容: Text-to-I…
一、Flux Dev生态的优势 Flux作为Julia语言生态下的主力深度学习框架,拥有丰富的模型库和工具集,涵盖了计算机视觉、自然语言处理、强化学习、图神经网络、时间序列等多个领…
要点: Black Forest Labs 今日宣布,开放邀请数月后,FLUX.1 Kontext [dev] 模型已全面进入公测阶段。 官方网站现可「一键体验」Kontext […
在生成式AI领域快速发展的今天,创作者与开发者不断寻找更强大、更高效的工具,以突破创意与性能的双重边界。Flux Kontext,由 Black Forest Labs 推出,是一…
苹果正式发布 FastVLM 开源视觉模型,专为 iPhone、IPad 设备优化的高速视觉模型,强调能以极低的延迟完成图文理解任务,并实现与大语言模型 GPT 和 Qwen 高度…
浙江大学、哈佛大学、南洋理工大学联合提出了统一的图像插入框架Insert Anything,支持多种实际场景,包括艺术创作、逼真的脸部交换、电影场景构图、虚拟服装试穿、配饰定制和数…