ElevenLabs đã phát hành phiên bản alpha của Eleven v3, mô hình chuyển văn bản thành giọng nói (TTS) của mình. Phiên bản mới này giới thiệu những tiến bộ đáng kể trong việc tạo giọng nói bằng AI.
Một tính năng quan trọng của Eleven v3 là hỗ trợ ngôn ngữ Nhật Bản, đáp ứng nhu cầu đã có từ lâu. Hơn nữa, nó kết hợp các khả năng về cảm xúc và hội thoại, giúp nó khác biệt so với các mô hình trước đó.
Eleven v3 mở rộng hỗ trợ ngôn ngữ từ 33 lên hơn 70 ngôn ngữ, tăng phạm vi phủ sóng dân số toàn cầu từ 60% lên 90%. Mô hình này cũng có chế độ đối thoại để chuyển đổi người nói tự nhiên và hỗ trợ thẻ giọng nói để biểu đạt sắc thái.
Giờ đây, người dùng có thể thêm các tín hiệu bằng giọng nói như tiếng thở dài và tiếng cười. Mô hình này cũng hỗ trợ các biểu hiện cảm xúc đa dạng trong một văn bản duy nhất. Hỗ trợ phát trực tuyến được lên kế hoạch trong tương lai gần, nhắm mục tiêu đến các trung tâm cuộc gọi và các tác nhân hội thoại theo thời gian thực.
Một bản dùng thử miễn phí có sẵn, cho phép người dùng kiểm tra các khả năng của Eleven v3. Gói miễn phí cho phép tạo tối đa 20.000 ký tự mỗi tháng, với tối đa 2.500 ký tự mỗi lần tạo.