ElevenLabs wydało wersję alpha Eleven v3, swojego modelu zamiany tekstu na mowę (TTS). Ta nowa wersja wprowadza znaczące ulepszenia w generowaniu głosu opartym na sztucznej inteligencji.
Kluczową cechą Eleven v3 jest obsługa języka japońskiego, odpowiadająca na długotrwałe zapotrzebowanie. Co więcej, zawiera możliwości emocjonalne i konwersacyjne, co odróżnia go od poprzednich modeli.
Eleven v3 rozszerza obsługę językową z 33 do ponad 70 języków, zwiększając zasięg populacji globalnej z 60% do 90%. Model oferuje również tryb dialogowy dla naturalnych przejść mówców i obsługę tagów głosowych dla niuansowej ekspresji.
Użytkownicy mogą teraz dodawać sygnały wokalne, takie jak westchnienia i śmiech. Model obsługuje również różnorodne wyrażenia emocjonalne w obrębie jednego tekstu. W najbliższej przyszłości planowane jest wsparcie strumieniowania, skierowane do centrów obsługi telefonicznej i agentów konwersacyjnych w czasie rzeczywistym.
Dostępna jest bezpłatna wersja próbna, pozwalająca użytkownikom przetestować możliwości Eleven v3. Bezpłatny plan pozwala na generowanie do 20 000 znaków miesięcznie, z maksymalnie 2 500 znaków na generację.