- CS-FLEURS: A Massively Multilingual and Code-Switched Speech Dataset [99.1]
CS-FLEURSは4つのテストセットから構成されており、52言語にまたがる113の独特な言語ペアをカバーしている。 CS-FLEURSはまた、16のX字対にわたる128時間の生成テキスト音声データのトレーニングセットも提供している。
論文 参考訳(メタデータ) (Wed, 17 Sep 2025 16:45:22 GMT) - リポジトリはbyan/cs-fleurs · Datasets at Hugging Face