IA Conversacional Lista para Producción a Escala Empresarial: Con Felix Su de Scale AI

Construyendo experiencias de IA controladas mediante arquitectura inteligente y medidas de seguridad

Scale logo on a purple background.

La IA empresarial exitosa no se trata solo de tener la última tecnología, sino de contar con la arquitectura y controles adecuados sobre los elementos básicos de IA. Los LLMs disponibles son poderosos, pero carecen de conocimiento profundo sobre cómo seguir la lógica empresarial, las directrices de marca y los principios de seguridad. Esta experiencia personalizada solo se puede lograr diseñando y probando cuidadosamente un sistema de prompts, LLMs, medidas de seguridad, herramientas y otros componentes para guiar el comportamiento de la IA generativa según las reglas de la empresa.

El Poder de la Separación: Por Qué la Arquitectura Importa

Al construir IA de Voz Conversacional, los desarrolladores pueden trabajar con modelos multimodales de voz a voz, o pueden unir las partes componentes de ASR (transcripción), LLMs y TTS. Para empresas con casos de uso específicos, esto último puede ser más práctico.

"En un entorno empresarial, la IA a menudo no puede hacerse solo con LLMs”, explica Felix Su, Jefe de Ingeniería de la Plataforma GenAI de Scale. “Se necesita diseñar un sistema complejo que siga la lógica empresarial, mantenga la imagen de marca y opere dentro de estrictas medidas de seguridad. Estos comportamientos son personalizados para cada empresa, por lo que es más práctico implementar estos sistemas sobre LLMs, en lugar de depender únicamente de su comportamiento latente. Aunque las capacidades multimodales se han integrado recientemente en los modelos directamente, la adopción de estos modelos en casos de uso críticos de producción ha sido más lenta de lo esperado. Esto se debe a la falta de control entre la generación y las entradas y salidas en su modalidad. En el caso de TIME AI, usar STT y TTS nos permitió controlar tanto las entradas a los LLMs basados en texto como proteger las salidas de nuestro sistema usando medidas de seguridad personalizadas. Esta técnica puede ser más práctica que usar directamente LLMs multimodales."

Al construir la experiencia TIME AI, Scale indexó el corpus de artículos de TIME en bases de conocimiento para recuperación bajo demanda, codificó la lógica empresarial en una serie de prompts del sistema y protegió las salidas de GenAI contra alucinaciones e infracciones tanto en seguridad como en directrices de marca. Sobre este sistema, dieron vida a la experiencia con una voz de la plataforma de orquestación de IA Conversacional de ElevenLabs.

Experiencia Persona del Año de TIME: Donde la Voz Marca la Diferencia

El reciente lanzamiento de TIME AI permite a los lectores participar en conversaciones naturales sobre el periodismo de TIME, incluida su icónica cobertura de Persona del Año. Lo que distingue a esta implementación de otros innumerables chatbots no es solo su conocimiento, sino la voz.

"Usar la voz realmente le dio un toque especial", reflexiona Su. "Sin ella, se pierde en el montón como otro chatbot más. Queríamos que el agente se sintiera como un compañero de lectura en vivo, disponible para profundizar en conversaciones fuera de guion." La implementación combina la experiencia de Scale AI en desarrollo de IA con la plataforma de IA Conversacional de ElevenLabs, creando una experiencia que se siente notablemente humana mientras mantiene un estricto control sobre el contenido y la voz de la marca.

Construyendo Sistemas Listos para Empresas

Para las empresas que buscan implementar IA conversacional a gran escala, colaborar con Scale AI y ElevenLabs ofrece un camino probado. Scale AI aporta una profunda experiencia en la construcción de sistemas de IA multimodales controlados y seguros con medidas de seguridad robustas, mientras que ElevenLabs proporciona tecnología de voz de primera clase que se puede integrar sin problemas en estos sistemas.

Aunque la implementación de TIME se centra en el periodismo, la misma arquitectura se puede aplicar a diversos casos de uso empresarial, particularmente en servicio y soporte al cliente. Los clientes están cansados de chatbots básicos y demandan interacciones más atractivas y humanas.

Gracias a Felix por contribuir a este post. Puedes encontrar a Felix Su en LinkedIn & X, y puedes experimentar la experiencia de voz de IA Conversacional que construyó con TIME en su Persona del Año 2024, así como Persona del Año de 2021, 2022 y 2023.

Los desarrolladores pueden comenzar con IA Conversacional usando nuestra documentación, y las empresas que buscan implementar soluciones de Voz Conversacional confiables en producción pueden ponerse en contacto con el equipo de soluciones empresariales en ElevenLabs y Scale.

Descubre artículos del equipo de ElevenLabs

ElevenLabs

Crea con audio con IA de la más alta calidad

Empieza gratis

¿Ya tienes una cuenta? Inicia sesión