通义千问发布新一代语音识别模型Qwen3‑ASR‑Flash：支持多语言与方言的高精度识别|AI 自学笔记

近日，阿里旗下通义千问团队推出了新一代语音识别模型Qwen3‑ASR‑Flash。该模型以Qwen3为底座，结合了千万小时级别的多模态与语音识别数据，在识别精度和鲁棒性上显著提升，支持11种语言及多种方言，在中英文及多语种基准测试中取得领先成绩。

业内人士认为，新模型不仅强化了通义千问在语音领域的技术布局，也为多语种、多场景的语音转文字服务带来了新的可能。

如果希望体验这一模型，可以通过以下入口：

ModelScope演示：https://modelscope.cn/studios/Qwen/Qwen3-ASR-Demo
HuggingFace演示：https://huggingface.co/spaces/Qwen/Qwen3-ASR-Demo
阿里云百炼API：https://bailian.console.aliyun.com/?tab=doc#/doc/?type=model&url=2979031

这一模型的出现有望进一步推动语音识别在教育、内容创作、客服等多个行业的应用。

通义千问发布新一代语音识别模型Qwen3‑ASR‑Flash：支持多语言与方言的高精度识别