ElevenLabs випустила альфа-версію Eleven v3, своєї моделі перетворення тексту в мовлення (TTS). Ця нова версія представляє значні досягнення в генерації голосу на основі штучного інтелекту.
Ключовою особливістю Eleven v3 є підтримка японської мови, що відповідає на давній попит. Крім того, вона включає емоційні та розмовні можливості, що відрізняє її від попередніх моделей.
Eleven v3 розширює підтримку мов з 33 до понад 70 мов, збільшуючи охоплення населення світу з 60% до 90%. Модель також має режим діалогу для природних переходів між мовцями та підтримку голосових тегів для нюансованого вираження.
Користувачі тепер можуть додавати голосові підказки, як-от зітхання та сміх. Модель також підтримує різноманітні емоційні вирази в межах одного тексту. Підтримка потокового передавання планується на найближче майбутнє, орієнтована на кол-центри та розмовних агентів у реальному часі.
Доступна безкоштовна пробна версія, що дозволяє користувачам протестувати можливості Eleven v3. Безкоштовний план дозволяє генерувати до 20 000 символів на місяць, з максимумом 2 500 символів на генерацію.