ElevenLabs lancia Eleven v3 Alpha con supporto della lingua giapponese ed espressione emotiva migliorata

12:53, 06 giugno

Modificato da: Veronika Radoslavskaya

ElevenLabs ha rilasciato la versione alpha di Eleven v3, il suo modello text-to-speech (TTS). Questa nuova versione introduce progressi significativi nella generazione vocale basata sull'IA.

Una caratteristica chiave di Eleven v3 è il suo supporto per la lingua giapponese, che risponde a una richiesta di lunga data. Inoltre, incorpora capacità emotive e conversazionali, distinguendosi dai modelli precedenti.

Eleven v3 espande il supporto linguistico da 33 a oltre 70 lingue, aumentando la copertura della popolazione mondiale dal 60% al 90%. Il modello presenta anche una modalità dialogo per transizioni naturali tra oratori e supporto di tag vocali per un'espressione sfumata.

Gli utenti possono ora aggiungere segnali vocali come sospiri e risate. Il modello supporta anche diverse espressioni emotive all'interno di un singolo testo. Il supporto allo streaming è previsto per il prossimo futuro, rivolto a call center e agenti di conversazione in tempo reale.

È disponibile una prova gratuita, che consente agli utenti di testare le capacità di Eleven v3. Il piano gratuito consente la generazione di fino a 20.000 caratteri al mese, con un massimo di 2.500 caratteri per generazione.

Fonti

GIGAZINE

Leggi altre notizie su questo argomento:

23 aprile

Character.AI lancia lo strumento di generazione video AvatarFX tra preoccupazioni per la sicurezza e cause legali

23 ottobre

Anthropic Unveils Enhanced AI Models Claude 3.5 Sonnet and Haiku with Computer Usage Feature

08 ottobre

OpenAI Launches AI Canvas Tool for Enhanced Writing and Coding

Hai trovato un errore o un'inaccuratezza?

Esamineremo il tuo commento il prima possibile.