- Qwen3-ASR Technical Report [71.9]
2つの強力なオールインワン音声認識モデルと、新しい非自己回帰音声強制アライメントモデルを含むQwen3-ASRファミリを紹介する。 Qwen3-ASR-1.7BとQwen3-ASR-0.6Bは、言語識別と52の言語および方言のASRをサポートするASRモデルである。
論文 参考訳(メタデータ) (Thu, 29 Jan 2026 06:58:13 GMT) - QwenシリーズのASR最新版。「Qwen3-ASR-1.7B and Qwen3- ASR-0.6B finely support 30 languages, 22 Chinese dialects ASR, and English from countries and regions worldwide.」と小型高性能。様々な公開モデルが出るのはとてもありがたい。
- リポジトリはGitHub – QwenLM/Qwen3-ASR: Qwen3-ASR is an open-source series of ASR models developed by the Qwen team at Alibaba Cloud, supporting stable multilingual speech/music/song recognition, language detection and timestamp prediction.