Microsoft представила три собственные ИИ-модели на фоне споров о Copilot
Отредактировано: Aleksandr Lytviak
Корпорация Microsoft 2 апреля 2026 года анонсировала выпуск трех новых проприетарных базовых моделей искусственного интеллекта, что знаменует собой стремление к «истинной самодостаточности в области ИИ» и прямое позиционирование против лидеров рынка, таких как OpenAI и Google. Разработки, созданные командой Microsoft AI под руководством Мустафы Сулеймана, стали доступны для коммерческого использования через платформу Microsoft Foundry и тестовую среду MAI Playground. Этот стратегический шаг последовал за реструктуризацией партнерства с OpenAI в октябре 2025 года, что позволило Microsoft развивать собственные передовые модели без прежних ограничений.
Первой представлена модель MAI-Transcribe-1, система преобразования речи в текст, которая, по заявлению Microsoft, устанавливает новый стандарт точности. В рамках отраслевого многоязычного теста FLEURS для 25 основных языков система продемонстрировала средний показатель частоты ошибок (WER) на уровне 3,8%. Внутренние данные компании указывают, что MAI-Transcribe-1 превосходит модель OpenAI Whisper-large-v3 по всем 25 языкам и опережает Google Gemini 3.1 Flash на 22 из 25 языков. Модель, разработанная небольшой командой инженеров, работает в 2,5 раза быстрее предыдущего предложения Azure Fast и предлагается по цене 0,36 доллара за час аудиозаписи. MAI-Transcribe-1 уже интегрируется в голосовой режим Copilot и Microsoft Teams для расшифровки бесед, что свидетельствует о намерении компании быстро заменить сторонние или устаревшие внутренние решения.
Вторым компонентом является MAI-Voice-1, модель синтеза речи, способная генерировать 60 секунд естественного аудиоконтента за одну секунду на одном графическом процессоре. Эта технология, конкурирующая с решениями ElevenLabs, поддерживает создание пользовательских голосов на основе коротких аудиообразцов, что является критически важным для разработки голосовых агентов. Стоимость генерации голоса установлена на уровне 22 доллара за миллион символов, что позиционирует Microsoft как поставщика комплексного голосового конвейера, работающего на собственной инфраструктуре. Третья модель, MAI-Image-2, представляет собой второе поколение генератора изображений, которое, по утверждению компании, обеспечивает как минимум удвоенную скорость по сравнению с предшественником. MAI-Image-2 уже входит в тройку лидеров мирового рейтинга Arena.ai, уступая только моделям от Google и OpenAI, и используется в продуктах, включая Bing и PowerPoint.
Параллельно с технологическими достижениями, Microsoft столкнулась с общественным резонансом из-за пункта в Условиях использования потребительской версии Copilot. В документе, обновленном в октябре 2025 года, прямо указано, что Copilot предназначен «только для развлекательных целей», и пользователям не следует полагаться на него для получения важных советов, используя его «на свой страх и риск». Это положение контрастирует с активным маркетингом Copilot как незаменимого инструмента для повышения производительности в Microsoft 365, что вызвало критику относительно доверия к продукту. Представитель компании назвал эту формулировку «устаревшим положением», которое не отражает текущего использования инструмента и будет изменено в следующем обновлении. Разработка собственных моделей, по словам Мустафы Сулеймана, является частью более широкой цели по созданию «гуманистического суперинтеллекта», остающегося под контролем человека, что также снижает стратегические риски, связанные с чрезмерной зависимостью от внешних поставщиков.
5 Просмотров
Источники
Business Insider
VentureBeat
AI Business
The Register
Business Insider
Mashable
Читайте больше статей по этой теме:
Вы нашли ошибку или неточность?Мы учтем ваши комментарии как можно скорее.



