ElevenLabs SFX APIを使ったサウンドボードの作成方法
ElevenLabsがどのようにして、テキストからサウンドエフェクトを生成するAIオーディオモデルを活用し、無限のサウンドボードSB1を作成したかを学びましょう。ユーザーは任意のサウンドをオンデマンドで生成できます。
無限に音を生成できるサウンドボードを想像してください。それがElevenLabsで開発したSB1です。こちらが無限サウンドボードです。見た目はクリックやキーボードショートカットで操作する一般的なパッドのグリッドですが、内部ではテキスト to サウンドエフェクトAIオーディオモデルで動作しています。
使い方は簡単で、思いつく音を説明するだけでSB1が生成します。あらかじめ定義されたデフォルトの音もありますが、それらも置き換えることができます。

コードに飛び込む前に、愛されるを使って、SB1になる基本的なプロトタイプバージョンを作成しました。まだAPIに接続されていませんが、デザインの選択やボタンの配置を実験する機会を得ました。その後、優秀なチームが最終的なUIとコードを作成しました。
動的なコンテンツを求めていました—その場で生成される任意のサウンド。私たちのソリューションの核はElevenLabs SFX APIです。このAPIは単一のエンドポイントの背後にあります:
1 | POST https://api.elevenlabs.io/v1/sound-generation |
プロンプト、必要なバリエーションの数(デフォルトは4)、APIキーをAuthorizationヘッダーに含めたJSONペイロードを送信します。
レスポンスは生成されたWAVファイルのURL配列を返します。そこからストリーミングやダウンロードを行い、各クリップをパッドに割り当てることができます。ループ設定も可能です。詳細なプロンプトを使用して、より具体的なサウンドを生成してください。
APIの主要な詳細
- エンドポイント:
/v1/sound-effects/generate
- メソッド: POST
- ヘッダー:
Authorization: Bearer YOUR_API_KEY
Content-Type: application/json
- ボディパラメータ:
prompt
(string): サウンドの説明n
(integer): バリエーションの数 (1–10)format
(string, optional): wav または mp3 (デフォルトは wav)
サンプルリクエストは次のようになります:
1 | { |
2 | "prompt": "rain hitting the roof of a tent", |
3 | "n": 4, |
4 | "format": "wav" |
5 | } |
6 |
そして、4つのURLの配列が返されます。APIはあらゆるユースケースにスケールするように設計されています—即席のサウンドボード作成からゲームアセットの大量生成まで。
SB1インターフェースの構築
APIが整ったところで、フロントエンドに取り掛かりました。SB1はReactとTailwind CSSで構築されたウェブアプリです。各パッドコンポーネントには2つのモードがあります:
- プリセット: 保存されたサウンドURLセットから読み込み
- カスタム: SFX APIを介してユーザーが生成
カスタムモードで空のパッドをクリックすると、プロンプトダイアログが表示されます。説明を入力し、生成を押すと、APIが4つのオプションを返します。それらをインラインで試聴し、お気に入りを選んでパッドが即座に更新されます。キーボードバインディングを使ってキーを押してパッドをトリガーし、リズムやサウンドキューをライブで再生できます。
ループコントロールも追加しました。ループボタンを押し、ループしたいサウンドをタップすると、解除するまで再生され続けます。これにより、SB1はジョークだけでなく、ドラムマシンやアンビエントな雰囲気、ポッドキャスト、ライブストリームのサウンドキュー、ガイド付き瞑想にも役立ちます。
実際の例
アンビエントサウンドスケープ
- 小雨: "葉に滴る小雨"
- 大雨: "トタン屋根に降る大雨"
- 海の波: 岸に打ち寄せる柔らかな波
「葉に滴る小雨」や「岸に打ち寄せる柔らかな波」といったプロンプトを送信して生成しました。それらのパッドをループ設定にし、集中や瞑想の背景を作り出しました。
ドラムマシン
- 808キック: "超低音の808キック"
- スネアヒット: "タイトなスネアスナップ"
- オープンシンバル: "鳴り響くオープンシンバル"