微软发布Mico:新一代 AI 伙伴,Clippy 以全新面貌回归

在本周的 Copilot 秋季发布会上,微软发布了全新的 AI 虚拟形象 Mico,这是公司在消费者端推进拟人化 AI 的最新尝试。Mico 的名字来自 “Microsoft Copilot”,它可以倾听用户、给出反应并通过变换颜色表达情绪,旨在打造一位温暖、可定制的数字伙伴。 令人会心一笑的是,这款角色还暗藏了彩蛋:在 Copilot 语音界面中多次点击 Mico,它会“变身”成 20 多年前广受讨论的 Office 助手 Clippy,让经典角色以 AI ...

read more..

通义千问发布新一代语音识别模型Qwen3‑ASR‑Flash:支持多语言与方言的高精度识别

近日,阿里旗下通义千问团队推出了新一代语音识别模型Qwen3‑ASR‑Flash。该模型以Qwen3为底座,结合了千万小时级别的多模态与语音识别数据,在识别精度和鲁棒性上显著提升,支持11种语言及多种方言,在中英文及多语种基准测试中取得领先成绩。 业内人士认为,新模型不仅强化了通义千问在语音领域的技术布局,也为多语种、多场景的语音转文字服务带来了新的可能。 如果希望体验这一模型,可以通过以下入口: ...

read more..

DeepSeek 发布 DeepSeek-V3.1-Terminus:优化语言一致性,强化 Agent 能力

2025年 9月 22 日,DeepSeek 正式发布其开源大语言模型的最新更新版——DeepSeek-V3.1-Terminus。该版本在前代 V3.1 的基础上,结合用户反馈进行了深度优化,重点提升了语言一致性与智能体能力。 据官方介绍,DeepSeek-V3.1-Terminus 同时提供思考模型与非思考模型,上下文窗口均为 128k,支持在线体验。输出长度方面,非思考模型默认 4K、最大 8K;思考模型默认 32K、最大 64K,以满足不同场景的需求。 此次...

read more..

AI 资讯周报(2025年10月17-24日):倡议与合作、产品更新、科学突破与安全

AI 资讯周报(2025年10月17-24日) 在过去的一周里,全球的 AI 动态不断,既有社会倡议,也有商业合作、产品更新、科学突破以及安全警示。以下是本周值得关注的要点: 全球科技与公共人物呼吁谨慎发展超级智能:超过 800 名公众人物(包括 AI 领域先驱 Geoffrey Hinton 和 Yoshua Bengio)联署公开信,呼吁在证明超级智能安全、可控并得到公众支持之前暂停相关开发 (www.harpersbazaar.com) 。英国哈里王...

read more..

Nano Banana 官方提示词指南

Gemini 可以通过对话方式生成和处理图片。你可以通过文字、图片或两者结合的方式向 Gemini 发出提示,从而以前所未有的控制力来创建、修改和迭代视觉内容: Text-to-Image::根据简单或复杂的文本描述生成高质量图片。 图片 + Text-to-Image(编辑):提供图片,并使用文本提示添加、移除或修改元素、更改风格或调整色彩分级。 多图到图(合成和风格迁移):使用多张输入图片合成新场景,或将一...

Nano Banana 官方提示词指南Nano Banana 官方提示词指南Nano Banana 官方提示词指南

read more..

完美继承与突破:Flux Dev 生态与Flux Krea模型发布

一、Flux Dev生态的优势 Flux作为Julia语言生态下的主力深度学习框架,拥有丰富的模型库和工具集,涵盖了计算机视觉、自然语言处理、强化学习、图神经网络、时间序列等多个领域。其开放、模块化和高性能的特性,为模型开发与创新提供了极大的便利。围绕Flux,Julia社区还发展出如FastAI.jl、ComfyUI等高阶训练与推理工具,让用户能够更灵活地构建和优化深度学习工作流。 二、Flux Krea模型简介 ...

完美继承与突破:Flux Dev 生态与Flux Krea模型发布

read more..

黑森林正式发布 FLUX.1 Kontext [dev] 公测版

要点: Black Forest Labs 今日宣布,开放邀请数月后,FLUX.1 Kontext [dev] 模型已全面进入公测阶段。 官方网站现可「一键体验」Kontext [dev],用户无需额外邀请即可试用在线 Demo。 同步在 Hugging Face 发布,模型以非商业许可(v1.1)提供下载与 API 调用,社区点赞数突破300。 Kontext [dev] 采用 12B 参数扩散 Transformer 架构,支持原位图像生成与编辑,示例创作效果令人惊艳。...

黑森林正式发布 FLUX.1 Kontext [dev] 公测版

read more..

Flux Kontext:释放AI创意力的新一代生成引擎

在生成式AI领域快速发展的今天,创作者与开发者不断寻找更强大、更高效的工具,以突破创意与性能的双重边界。Flux Kontext,由 Black Forest Labs 推出,是一款旨在推动图像生成体验革新的新一代模型框架。 什么是 Flux Kontext? Flux Kontext 是一个高度模块化、可扩展的生成引擎框架,专为 AI 视觉创作而生。它在底层架构上优化了图像生成流程,支持多模态输入(如文本+图像)、多阶段生成、...

Flux Kontext:释放AI创意力的新一代生成引擎

read more..

【AI短讯】苹果开源视觉模型 FastVLM

苹果正式发布 FastVLM 开源视觉模型,专为 iPhone、IPad 设备优化的高速视觉模型,强调能以极低的延迟完成图文理解任务,并实现与大语言模型 GPT 和 Qwen 高度整合。 FastVLM的主要功能是将高解析图像实时转换为语言模型可处理的视觉token,让设备得以在本地直接进行图像描述、问答分析等任务,无需仰赖云端资源或高耗能硬件。架构包含轻量级视觉主干FastViTHD,以及可与开源语言模型搭配的解码器...

【AI短讯】苹果开源视觉模型 FastVLM【AI短讯】苹果开源视觉模型 FastVLM

read more..

Insert Anything: 开源图像无缝插入编辑框架

浙江大学、哈佛大学、南洋理工大学联合提出了统一的图像插入框架Insert Anything,支持多种实际场景,包括艺术创作、逼真的脸部交换、电影场景构图、虚拟服装试穿、配饰定制和数字道具更换,下图展示了其在各种图像编辑任务中的多功能性和有效性。 效果展示 相关链接 论文:https://arxiv.org/pdf/2504.15009 主页:https://song-wensong.github.io/insert-anything 结论 Ins...

Insert Anything: 开源图像无缝插入编辑框架

read more..