ElevenLabs ha rilasciato la versione alpha di Eleven v3, il suo modello text-to-speech (TTS). Questa nuova versione introduce progressi significativi nella generazione vocale basata sull'IA.
Una caratteristica chiave di Eleven v3 è il suo supporto per la lingua giapponese, che risponde a una richiesta di lunga data. Inoltre, incorpora capacità emotive e conversazionali, distinguendosi dai modelli precedenti.
Eleven v3 espande il supporto linguistico da 33 a oltre 70 lingue, aumentando la copertura della popolazione mondiale dal 60% al 90%. Il modello presenta anche una modalità dialogo per transizioni naturali tra oratori e supporto di tag vocali per un'espressione sfumata.
Gli utenti possono ora aggiungere segnali vocali come sospiri e risate. Il modello supporta anche diverse espressioni emotive all'interno di un singolo testo. Il supporto allo streaming è previsto per il prossimo futuro, rivolto a call center e agenti di conversazione in tempo reale.
È disponibile una prova gratuita, che consente agli utenti di testare le capacità di Eleven v3. Il piano gratuito consente la generazione di fino a 20.000 caratteri al mese, con un massimo di 2.500 caratteri per generazione.