A ElevenLabs lançou a versão alfa do Eleven v3, seu modelo de texto para fala (TTS). Esta nova versão introduz avanços significativos na geração de voz impulsionada por IA.
Uma característica chave do Eleven v3 é seu suporte para o idioma japonês, atendendo a uma demanda de longa data. Além disso, incorpora capacidades emocionais e conversacionais, diferenciando-o dos modelos anteriores.
O Eleven v3 expande o suporte de idiomas de 33 para mais de 70 idiomas, aumentando a cobertura da população global de 60% para 90%. O modelo também apresenta um modo de diálogo para transições naturais de falantes e suporte de tags de voz para expressão matizada.
Os usuários agora podem adicionar dicas vocais como suspiros e risadas. O modelo também suporta diversas expressões emocionais dentro de um único texto. O suporte de streaming está planejado para o futuro próximo, visando call centers e agentes de conversação em tempo real.
Uma avaliação gratuita está disponível, permitindo que os usuários testem as capacidades do Eleven v3. O plano gratuito permite a geração de até 20.000 caracteres por mês, com um máximo de 2.500 caracteres por geração.