ElevenLabs uruchamia Eleven v3 Alpha z obsługą języka japońskiego i ulepszoną ekspresją emocjonalną

Edytowane przez: Veronika Radoslavskaya

ElevenLabs wydało wersję alpha Eleven v3, swojego modelu zamiany tekstu na mowę (TTS). Ta nowa wersja wprowadza znaczące ulepszenia w generowaniu głosu opartym na sztucznej inteligencji.

Kluczową cechą Eleven v3 jest obsługa języka japońskiego, odpowiadająca na długotrwałe zapotrzebowanie. Co więcej, zawiera możliwości emocjonalne i konwersacyjne, co odróżnia go od poprzednich modeli.

Eleven v3 rozszerza obsługę językową z 33 do ponad 70 języków, zwiększając zasięg populacji globalnej z 60% do 90%. Model oferuje również tryb dialogowy dla naturalnych przejść mówców i obsługę tagów głosowych dla niuansowej ekspresji.

Użytkownicy mogą teraz dodawać sygnały wokalne, takie jak westchnienia i śmiech. Model obsługuje również różnorodne wyrażenia emocjonalne w obrębie jednego tekstu. W najbliższej przyszłości planowane jest wsparcie strumieniowania, skierowane do centrów obsługi telefonicznej i agentów konwersacyjnych w czasie rzeczywistym.

Dostępna jest bezpłatna wersja próbna, pozwalająca użytkownikom przetestować możliwości Eleven v3. Bezpłatny plan pozwala na generowanie do 20 000 znaków miesięcznie, z maksymalnie 2 500 znaków na generację.

Źródła

  • GIGAZINE

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.