Audio Diffusion Modelに関するサーベイ

A Survey on Audio Diffusion Models: Text To Speech Synthesis and Enhancement in Generative AI [64.7]
生成AIは様々な分野で印象的な性能を示しており、音声合成は興味深い方向である。拡散モデルを最も一般的な生成モデルとし、テキストから音声への拡張と音声への拡張という2つのアクティブなタスクを試みている。本研究は,既存の調査を補完する音声拡散モデルに関する調査を行う。
論文参考訳（メタデータ） (Sun, 2 Apr 2023 09:27:20 GMT)
text-to-speechとspeech enhancementを対象とした拡散モデル利用のサーベイ

コメントを残す

コメントを残す コメントをキャンセル