ElevenLabs запускає Eleven v3 Alpha з підтримкою японської мови та покращеним емоційним вираженням

Відредаговано: Veronika Radoslavskaya

ElevenLabs випустила альфа-версію Eleven v3, своєї моделі перетворення тексту в мовлення (TTS). Ця нова версія представляє значні досягнення в генерації голосу на основі штучного інтелекту.

Ключовою особливістю Eleven v3 є підтримка японської мови, що відповідає на давній попит. Крім того, вона включає емоційні та розмовні можливості, що відрізняє її від попередніх моделей.

Eleven v3 розширює підтримку мов з 33 до понад 70 мов, збільшуючи охоплення населення світу з 60% до 90%. Модель також має режим діалогу для природних переходів між мовцями та підтримку голосових тегів для нюансованого вираження.

Користувачі тепер можуть додавати голосові підказки, як-от зітхання та сміх. Модель також підтримує різноманітні емоційні вирази в межах одного тексту. Підтримка потокового передавання планується на найближче майбутнє, орієнтована на кол-центри та розмовних агентів у реальному часі.

Доступна безкоштовна пробна версія, що дозволяє користувачам протестувати можливості Eleven v3. Безкоштовний план дозволяє генерувати до 20 000 символів на місяць, з максимумом 2 500 символів на генерацію.

Джерела

  • GIGAZINE

Знайшли помилку чи неточність?

Ми розглянемо ваші коментарі якомога швидше.