ElevenLabs выпустила альфа-версию Eleven v3, своей модели преобразования текста в речь (TTS). Эта новая версия представляет собой значительные улучшения в генерации голоса на основе ИИ.
Ключевой особенностью Eleven v3 является поддержка японского языка, отвечающая на давнюю потребность. Кроме того, она включает в себя эмоциональные и разговорные возможности, что отличает ее от предыдущих моделей.
Eleven v3 расширяет языковую поддержку с 33 до более чем 70 языков, увеличивая охват населения мира с 60% до 90%. Модель также имеет режим диалога для естественных переходов между говорящими и поддержку голосовых тегов для нюансированного выражения.
Пользователи теперь могут добавлять голосовые подсказки, такие как вздохи и смех. Модель также поддерживает различные эмоциональные выражения в рамках одного текста. Поддержка потоковой передачи планируется на ближайшее будущее, ориентируясь на колл-центры и агентов для разговоров в реальном времени.
Доступна бесплатная пробная версия, позволяющая пользователям протестировать возможности Eleven v3. Бесплатный план позволяет генерировать до 20 000 символов в месяц, с максимумом 2 500 символов за генерацию.