ElevenLabs sale de la beta y lanza Eleven Multilingual v2, un modelo básico de voz IA en 30 idiomas

  • Plataforma de voz IAElevenLabs ha lanzado un nuevo modelo de aprendizaje profundo que soporta funciones multilingües en 30 idiomasEleven Multilingual v2. Un avance radical en la eliminación de barreras lingüísticas en el contenido.
  • Este avance permite a empresas de medios, desarrolladores de juegos, editores y creadores independientes de todo el mundo mejorar dramáticamente la accesibilidad de su contenido.
  • Desde el lanzamiento de la plataforma en enero, esta nueva función sigue a una serie de lanzamientos y mejoras de nuevas características, marcando el fin oficial de la fase beta de la empresa.
  • La misión de ElevenLabs es hacer que todo el contenido sea universalmente accesible en todos los idiomas y voces

Londres, Reino UnidoLondres, Reino Unido - Líder mundial en software de voz IA,ElevenLabs ha anunciado un nuevo modelo de generación de voz multilingüe que puede crear voces IA "emocionales" con precisión en 30 idiomas.

Este avance se basa completamente en investigación interna, permitiendo a creadores producir contenido de voz localizado para mercados internacionales en Europa, Asia y Oriente Medio. ElevenLabs ha analizado marcadores del habla humana durante 18 meses, construyendo nuevos mecanismos para la comprensión del contexto, la expresión emocional en la generación de voz y la síntesis de voces únicas.

Con Eleven Multilingual v2, al introducir texto en la plataforma de Text to Speech de ElevenLabs,el nuevo modelo reconoce automáticamente unos 30 idiomas escritos y genera voz con un nivel de fiabilidad sin precedentes.

Al mismo tiempo, se mantienen los acentos únicos y las características de la voz del hablante en todos los idiomas, ya sea que se utilice una voz sintética o clonada. Esto significa que puedes dar vida al contenido en 30 idiomas diferentes usando la misma voz.

Tras estelanzamiento, el Voice Cloning profesional se ha hecho público en la plataforma. Esta actualización de producto se lanza junto con funciones adicionales de seguridad, permitiendo a los usuarios crear una copia digital perfecta de su propia voz.

Indistinguible de la voz original. El lanzamiento de hoy significa que puedes hablar en casi 30 idiomas que ofrece el modelo multilingüe usando tu propia voz.

Idiomas compatibles: Coreano, neerlandés, turco, sueco, indonesio, vietnamita, filipino, ucraniano, griego, checo, finlandés, rumano, danés, búlgaro, malayo, húngaro, noruego, eslovaco, croata, árabe clásico, tamil. Estos se suman a los idiomas previamente disponibles como inglés, polaco, alemán, español, francés, italiano, hindi y portugués.

Tras el reciente lanzamiento de funciones y la mejora continua de la plataforma, ElevenLabs anuncia hoy que la plataforma pasa oficialmente de la versión beta a la versión completa. Esta transición es un momento crucial en el compromiso de la empresa de proporcionar herramientas avanzadas y fiables a más de un millón de usuarios globales.

En el futuro, ElevenLabs planea introducir mecanismos que permitan a los usuarios compartir voces en la plataforma, beneficiarse del desarrollo de nuevos audios y fomentar oportunidades de colaboración entre humanos e IA.

Mati Staniszewski, CEO y cofundador de ElevenLabs, comenta:

ElevenLabs comenzó con el sueño de hacer que todo el contenido sea universalmente accesible en todos los idiomas y voces. Con el lanzamiento de Eleven Multilingual v2, hemos dado un paso más hacia la realización de este sueño, acercándonos al uso de voces IA de calidad humana en todos los dialectos.IA.

“Las herramientas de generación de Text to Speech nivelan el campo de juego, proporcionando a todos los creadores funciones de audio de la más alta calidad. Estas ventajas ahora se extienden a aplicaciones multilingües en casi30 idiomas. Finalmente, con la ayuda deIA, queremos cubrir aún más idiomas y voces, eliminando las barreras lingüísticas para el contenido. En ElevenLabs creemos que estos avances en accesibilidad finalmente promoverán la creatividad, la innovación y la diversidad.”

ElevenLabs permite a empresas y creadores producir contenido más imaginativo y accesible que resuene a través de múltiples culturas e idiomas, reduciendo el coste y los recursos necesarios para crear contenido de audio de alta calidad en varios idiomas.

Para desarrolladores de juegos independientes y editores, las herramientas de generación de voz multilingüe ofrecen nuevas oportunidades para conectar con jugadores y oyentes en su idioma, traduciendo experiencias de juego y contenido de voz para audiencias internacionales sin comprometer la calidad o precisión de la voz.

De igual manera, las instituciones educativas ahora tienen los medios para proporcionar instantáneamente contenido de audio preciso en el idioma objetivo a los estudiantes, mejorando la comprensión del idioma y las habilidades de pronunciación, y atendiendo a diversos estilos de enseñanza y necesidades de aprendizaje de estudiantes internacionales.

Todo tipo de creadores pueden utilizar las herramientas de ElevenLabs para complementar contenido visual con voz disponible en múltiples idiomas, mejorando laaccesibilidad del contenido para personas con discapacidades visuales o necesidades de aprendizaje.

La primera suite de herramientas de voz IA lanzada en enero de 2023 incluía varias voces sintéticas predefinidas y la capacidad de clonar tu propia voz. Las herramientas de voz multilingüe son el siguiente paso en la misión de ElevenLabs de hacer que todo el contenido sea universalmente accesible en todos los idiomas y voces.

Esta tecnología ya se está adoptando en varios sectores creativos y verticales, como la creación de audiolibros por escritores independientes, voces para personajes secundarios en videojuegos, apoyo para que personas con discapacidades visuales accedan a contenido escrito en línea, y como motor de la primera radio Al del mundo. ElevenLabs también se ha asociado con generadores de video IAD-ID, uno de los mayores editores de audiolibros del mundo,Storytel,la plataforma de video científico de acceso abiertoScienceCast que condensa artículos de investigación científica publicados enarXiv,la plataforma líder de creación de contenidoTheSoul Publishing, Embark Studios yParadox Interactive, así como con plataformas de mediosMNTN, entre otros destacados creadores de contenido, estudios y plataformas de medios.

Descubre artículos del equipo de ElevenLabs

Resources
Comparison of "cartesia/ai" versus "IIElevenLabs" in bold text on a white background.