ElevenLabs lance Eleven v3 Alpha avec prise en charge du japonais et une expression émotionnelle améliorée

Édité par : Veronika Radoslavskaya

ElevenLabs a publié la version alpha d'Eleven v3, son modèle de synthèse vocale (TTS). Cette nouvelle version introduit des avancées significatives dans la génération vocale basée sur l'IA.

Une caractéristique clé d'Eleven v3 est sa prise en charge de la langue japonaise, répondant à une demande de longue date. De plus, elle intègre des capacités émotionnelles et conversationnelles, ce qui la distingue des modèles précédents.

Eleven v3 étend la prise en charge linguistique de 33 à plus de 70 langues, augmentant la couverture de la population mondiale de 60 % à 90 %. Le modèle propose également un mode dialogue pour des transitions de locuteurs naturelles et la prise en charge des balises vocales pour une expression nuancée.

Les utilisateurs peuvent désormais ajouter des indices vocaux tels que des soupirs et des rires. Le modèle prend également en charge diverses expressions émotionnelles au sein d'un même texte. La prise en charge du streaming est prévue pour un avenir proche, ciblant les centres d'appels et les agents conversationnels en temps réel.

Un essai gratuit est disponible, permettant aux utilisateurs de tester les capacités d'Eleven v3. Le plan gratuit permet la génération de jusqu'à 20 000 caractères par mois, avec un maximum de 2 500 caractères par génération.

Sources

  • GIGAZINE

Avez-vous trouvé une erreur ou une inexactitude ?

Nous étudierons vos commentaires dans les plus brefs délais.