近日,阿里旗下通义千问团队推出了新一代语音识别模型Qwen3‑ASR‑Flash。该模型以Qwen3为底座,结合了千万小时级别的多模态与语音识别数据,在识别精度和鲁棒性上显著提升,支持11种语言及多种方言,在中英文及多语种基准测试中取得领先成绩。
业内人士认为,新模型不仅强化了通义千问在语音领域的技术布局,也为多语种、多场景的语音转文字服务带来了新的可能。
如果希望体验这一模型,可以通过以下入口:
- ModelScope演示:https://modelscope.cn/studios/Qwen/Qwen3-ASR-Demo
- HuggingFace演示:https://huggingface.co/spaces/Qwen/Qwen3-ASR-Demo
- 阿里云百炼API:https://bailian.console.aliyun.com/?tab=doc#/doc/?type=model&url=2979031
这一模型的出现有望进一步推动语音识别在教育、内容创作、客服等多个行业的应用。