ElevenLabs ha lanzado la versión alfa de Eleven v3, su modelo de texto a voz (TTS). Esta nueva versión introduce avances significativos en la generación de voz impulsada por IA.
Una característica clave de Eleven v3 es su soporte para el idioma japonés, abordando una demanda de larga data. Además, incorpora capacidades emocionales y conversacionales, lo que lo distingue de los modelos anteriores.
Eleven v3 expande el soporte de idiomas de 33 a más de 70 idiomas, aumentando la cobertura de la población mundial del 60% al 90%. El modelo también presenta un modo de diálogo para transiciones naturales de hablantes y soporte de etiquetas de voz para una expresión matizada.
Los usuarios ahora pueden agregar señales vocales como suspiros y risas. El modelo también admite diversas expresiones emocionales dentro de un solo texto. Se planea soporte de transmisión para el futuro cercano, dirigido a centros de llamadas y agentes de conversación en tiempo real.
Hay una prueba gratuita disponible, que permite a los usuarios probar las capacidades de Eleven v3. El plan gratuito permite la generación de hasta 20.000 caracteres por mes, con un máximo de 2.500 caracteres por generación.