
Adicione voz aos seus agentes na web, mobile ou telefonia em minutos. Nossa API em tempo real oferece baixa latência, total configurabilidade e escalabilidade perfeita.
No Hackathon da ElevenLabs em Londres, desenvolvedores criaram o GibberLink, um protocolo que permite que agentes de IA se reconheçam e mudem para uma linguagem baseada em som super eficiente
O que acontece quando dois assistentes de voz IA conversam? Se a IA está falando com outra IA, por que se preocupar com as ineficiências da fala humana? Por que usar palavras quando dados puros são mais rápidos, precisos e sem erros?
Foi exatamente isso que aconteceu no Hackathon da ElevenLabs em Londres, onde os desenvolvedores Boris Starkov e Anton Pidkuiko apresentaram GibberLink, um mecanismo que permite que agentes de IA se reconheçam e mudem para um novo modo de comunicação — mais eficiente que a linguagem falada. E não demorou para a ideia se tornar viral, com compartilhamentos de Marques Brownlee, Tim Urban e outros.
A ideia por trás do GibberLink é simples: a IA não precisa falar como os humanos. Durante o hackathon, Starkov e Pidkuiko exploraram as limitações da fala tradicional de IA para IA e perceberam que poderiam eliminar complexidades desnecessárias permitindo que a IA conversasse de uma forma otimizada para máquinas.
Esse conceito surgiu durante o Hackathon, onde Starkov e Pidkuiko estavam experimentando o produto de Conversational AI da ElevenLabs, que permite conectar qualquer LLM e criar um agente.
Starkov escreveu no LinkedIn: "Queríamos mostrar que no mundo onde agentes de IA podem fazer e receber chamadas (ou seja, hoje), eles ocasionalmente conversariam entre si — e gerar fala semelhante à humana para isso seria um desperdício de computação, dinheiro, tempo e meio ambiente. Em vez disso, eles deveriam mudar para um protocolo mais eficiente assim que se reconhecessem como IA."
Combinando a tecnologia da ElevenLabs Conversational AI com ggwave, uma biblioteca open-source de dados sobre som, eles criaram um sistema onde assistentes de IA podem detectar quando estão falando com outra IA e mudar instantaneamente para um modo de comunicação mais eficiente — transmitindo dados estruturados por ondas sonoras em vez de palavras.
Eles usaram o ggwave por ser "a solução mais conveniente e estável que encontramos no tempo de um hackathon", mas existem outros mecanismos para alcançar os mesmos ou similares resultados. Starkov escreveu: "Modems discados usavam algoritmos semelhantes para transmitir informações via som desde os anos 80, e vários protocolos surgiram desde então."
O código do mecanismo foi auditado por engenheiros da ElevenLabs e durante a demonstração, um agente de Conversational AI foi instruído a reservar um quarto de hotel para um casamento, o outro a atender o pedido (fazendo o papel do sistema de reservas do hotel). Eles também foram instruídos a mudar para o protocolo de nível sonoro se acreditassem que o outro também era um agente de IA, mas não foram informados de que o outro era um agente.
Há um momento de realização no vídeo da demonstração onde a IA que faz o papel do cliente declara que é um agente. A IA de reservas responde e pergunta sobre mudar para o Gibberlink. Parece uma dupla de modems discados competindo com o R2D2 pelo título de voz do ano. Você pode ver destaques dessa conversa digital em texto na tela de cada dispositivo usado na demonstração, incluindo perguntas sobre número de convidados e datas.
Mais especificamente, um par de agentes de Conversational AI da ElevenLabs começa a falar em linguagem humana. Ambos usam uma função de chamada para acionar o modo Gibberlink se as condições certas forem atendidas. Se a ferramenta for chamada, a chamada da ElevenLabs é encerrada e o protocolo "data over sound" do ggwave assume, mas com o mesmo thread LLM.
Starkov diz que foi "a magia das ferramentas que a ElevenLabs fornece" que tornou isso possível, já que nosso sistema de Conversational AI "permite que você instrua a IA a executar código personalizado em certas circunstâncias." O resultado? Comunicação mais rápida, sem erros e com maior eficiência.
Como o GibberLink Quebrou a Internet
Adicione voz aos seus agentes na web, mobile ou telefonia em minutos. Nossa API em tempo real oferece baixa latência, total configurabilidade e escalabilidade perfeita.