通义千问发布新一代语音识别模型Qwen3‑ASR‑Flash:支持多语言与方言的高精度识别

2025-10-26 83 0

近日,阿里旗下通义千问团队推出了新一代语音识别模型Qwen3‑ASR‑Flash。该模型以Qwen3为底座,结合了千万小时级别的多模态与语音识别数据,在识别精度和鲁棒性上显著提升,支持11种语言及多种方言,在中英文及多语种基准测试中取得领先成绩。

业内人士认为,新模型不仅强化了通义千问在语音领域的技术布局,也为多语种、多场景的语音转文字服务带来了新的可能。

如果希望体验这一模型,可以通过以下入口:

  • ModelScope演示:https://modelscope.cn/studios/Qwen/Qwen3-ASR-Demo
  • HuggingFace演示:https://huggingface.co/spaces/Qwen/Qwen3-ASR-Demo
  • 阿里云百炼API:https://bailian.console.aliyun.com/?tab=doc#/doc/?type=model&url=2979031

这一模型的出现有望进一步推动语音识别在教育、内容创作、客服等多个行业的应用。

相关文章

谷歌发布Gemini 3:百万级上下文与全链路 Agent 引领 AI 新纪元
AI视频像素级角色与物品参考:BindWeave模型与ComfyUI部署实测
谷歌Gemini平台将推出Nano Banana2,图像生成效率与风格多样性升级
重磅发布:MiniMax M2 开源模型 —— 低成本高性能新时代
开源AI新浪潮:十月风云变幻,模型竞赛进入“效率为王”新阶段
近一周开源模型动态汇总(2025年10月21日–28日)