もし興味があれば、こちらにリンクがあります:https://audiobox.metademolab.com/(魔法は必要ありません)
Audiobox Maker を通じて、初心者のユーザーでもさまざまなキャラクター(赤ずきん、オオカミ、おばあさんなど)の音声ファイルを設計し、生成することができます。さらに、さまざまな効果音を追加し、ファイルをドラッグアンドドロップして組み合わせることで、レゴのように自分自身で物語を作り上げることができます。
実際には、Audiobox は 6 つの AI ツールが統合された「モデルシリーズ」と見なすことができます。これには、音声のクローン作成、テキストから音声への変換、テキストから効果音への変換(拍手、犬の鳴き声、車のクラクション、雷など)、指定した場所に効果音を追加または指定した部分を削除する機能が含まれています。
結果は以下の通りです:
Meta は、最先端の製品と比較して、Audiobox が FAD(Frechet Audio Distance の略で、値が小さいほど良い)を 50%低下させ、品質と忠実度の面で実際のオーディオに匹敵すると主張しています。