ElevenLabs uruchamia Eleven v3 Alpha z obsługą języka japońskiego i ulepszoną ekspresją emocjonalną

12:53, 06 czerwca

Edytowane przez: Veronika Radoslavskaya

ElevenLabs wydało wersję alpha Eleven v3, swojego modelu zamiany tekstu na mowę (TTS). Ta nowa wersja wprowadza znaczące ulepszenia w generowaniu głosu opartym na sztucznej inteligencji.

Kluczową cechą Eleven v3 jest obsługa języka japońskiego, odpowiadająca na długotrwałe zapotrzebowanie. Co więcej, zawiera możliwości emocjonalne i konwersacyjne, co odróżnia go od poprzednich modeli.

Eleven v3 rozszerza obsługę językową z 33 do ponad 70 języków, zwiększając zasięg populacji globalnej z 60% do 90%. Model oferuje również tryb dialogowy dla naturalnych przejść mówców i obsługę tagów głosowych dla niuansowej ekspresji.

Użytkownicy mogą teraz dodawać sygnały wokalne, takie jak westchnienia i śmiech. Model obsługuje również różnorodne wyrażenia emocjonalne w obrębie jednego tekstu. W najbliższej przyszłości planowane jest wsparcie strumieniowania, skierowane do centrów obsługi telefonicznej i agentów konwersacyjnych w czasie rzeczywistym.

Dostępna jest bezpłatna wersja próbna, pozwalająca użytkownikom przetestować możliwości Eleven v3. Bezpłatny plan pozwala na generowanie do 20 000 znaków miesięcznie, z maksymalnie 2 500 znaków na generację.

Źródła

GIGAZINE

Przeczytaj więcej wiadomości na ten temat:

23 kwietnia

Character.AI uruchamia AvatarFX – narzędzie do generowania wideo, w cieniu obaw o bezpieczeństwo i pozwów

23 października

Anthropic Unveils Enhanced AI Models Claude 3.5 Sonnet and Haiku with Computer Usage Feature

08 października

OpenAI Launches AI Canvas Tool for Enhanced Writing and Coding

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.