Hur vi skapade en ljudbräda med ElevenLabs SFX API

Lär dig hur ElevenLabs skapade SB1, en oändlig ljudbräda driven av deras text-till-ljudeffekter AI-ljudmodell, som låter användare generera vilket ljud som helst på begäran.

SB1

Föreställ dig ett ljudbord som kan generera obegränsade ljud på begäran. Det är precis vad vi har byggt på ElevenLabs — möt SB1, vår oändliga ljudbord. På ytan ser det ut som ett typiskt rutnät av pads som du aktiverar med klick eller kortkommandon. Under huven drivs det av vår text-to-sound effects AI-ljudmodell.

För att använda det beskriver du helt enkelt vilket ljud du kan tänka dig, och SB1 kommer att generera det. Det finns också några fördefinierade standardljud, men även de kan bytas ut.

Från idé till prototyp

Vi började med en enkel fråga: vad om du kunde skriva en beskrivning, som “mjuka omgivande skogsljud” eller “dramatiskt publikgasp,” och få en färdig ljudeffekt?

Traditionella ljudbrädor förlitar sig på statiska MP3-bibliotek du måste leta upp online. Även om du hittar ett lämpligt ljud är det ofta inte ‘exakt’ vad du ville ha. Men med generativ AI är det inte längre ett problem. Du är inte längre begränsad.

SB1 Prototype

Innan vi hoppade in i koden vände vi oss till Älskvärd för att skapa en grundläggande prototypversion av vad som skulle bli SB1. Inte kopplad till API ännu, gav det oss en chans att experimentera med designval och knappplaceringar, innan vårt briljanta team skapade den slutliga UI och koden.

Vi ville ha dynamiskt innehåll — vilket ljud som helst, genererat direkt. Kärnan i vår lösning är ElevenLabs SFX API. API:et sitter bakom en enda slutpunkt:

1POST https://api