ElevenLabs startet Eleven v3 Alpha mit japanischer Sprachunterstützung und verbesserter emotionaler Ausdrucksfähigkeit

12:53, 06 Juni

Bearbeitet von: Veronika Radoslavskaya

ElevenLabs hat die Alpha-Version von Eleven v3, seinem Text-to-Speech (TTS)-Modell, veröffentlicht. Diese neue Version führt bedeutende Fortschritte in der KI-gesteuerten Stimmgenerierung ein.

Ein Hauptmerkmal von Eleven v3 ist die Unterstützung der japanischen Sprache, die eine langjährige Forderung erfüllt. Darüber hinaus integriert es emotionale und konversationelle Fähigkeiten, was es von früheren Modellen abhebt.

Eleven v3 erweitert die Sprachunterstützung von 33 auf über 70 Sprachen und erhöht die globale Bevölkerungsabdeckung von 60 % auf 90 %. Das Modell bietet außerdem einen Dialogmodus für natürliche Sprecherübergänge und Voice-Tag-Unterstützung für differenzierte Ausdrucksformen.

Benutzer können jetzt vokale Hinweise wie Seufzer und Lachen hinzufügen. Das Modell unterstützt auch vielfältige emotionale Ausdrücke innerhalb eines einzigen Textes. Streaming-Unterstützung ist für die nahe Zukunft geplant und zielt auf Callcenter und Echtzeit-Konversationsagenten ab.

Eine kostenlose Testversion ist verfügbar, mit der Benutzer die Fähigkeiten von Eleven v3 testen können. Der kostenlose Plan ermöglicht die Generierung von bis zu 20.000 Zeichen pro Monat, mit maximal 2.500 Zeichen pro Generierung.

Quellen

GIGAZINE

Weitere Nachrichten zu diesem Thema lesen:

23 April

Character.AI startet AvatarFX-Videogenerierungstool inmitten von Sicherheitsbedenken und Klagen

23 Oktober

Anthropic stellt verbesserte KI-Modelle Claude 3.5 Sonnet und Haiku mit Computer-Nutzungsfunktion vor

08 Oktober

OpenAI Führt AI Canvas Tool zur Verbesserung von Schreiben und Programmieren ein

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.