OpenAI представила две новые модели с открытыми весами, gpt-oss-120b и gpt-oss-20b, что знаменует собой важный шаг в направлении открытого ИИ. Эти модели, выпущенные под лицензией Apache 2.0, предназначены для расширенных задач рассуждения и оптимизированы для работы на потребительском оборудовании. Модель gpt-oss-20b может работать на устройствах с 16 ГБ памяти, что делает ее подходящей для персональных компьютеров и периферийных устройств, в то время как gpt-oss-120b требует для эффективной работы один графический процессор с 80 ГБ памяти. Такая доступность позволяет разработчикам и исследователям использовать мощные возможности ИИ, не полагаясь исключительно на облачные сервисы, что способствует большему контролю и настройке.
Выпуск моделей gpt-oss особенно актуален в условиях растущей конкуренции в пространстве моделей с открытыми весами. Эти модели превосходно справляются с задачами кодирования, математики и запросами, связанными со здоровьем, демонстрируя производительность, сопоставимую с проприетарными моделями OpenAI. Архитектура моделей включает в себя Mixture-of-Experts (MoE), что снижает вычислительную нагрузку на токен, повышая эффективность. Кроме того, модели поддерживают следование инструкциям и использование инструментов, включая веб-поиск и интерпретацию кода, что позволяет им справляться со сложными задачами и агентскими рабочими процессами. Модели также разработаны с возможностью глубокой настройки, с регулируемыми уровнями рассуждения и предлагают полный доступ к цепочке рассуждений для упрощения отладки.
Переход OpenAI к моделям с открытыми весами — это стратегический шаг, обеспечивающий «демократическую» инфраструктуру ИИ. Модели доступны на таких платформах, как Amazon Web Services (AWS), включая Amazon Bedrock и Amazon SageMaker AI, что еще больше расширяет их охват и удобство использования. Модель gpt-oss-120b достигает почти паритета с OpenAI o4-mini по основным эталонам рассуждения, в то время как модель gpt-oss-20b обеспечивает результаты, аналогичные OpenAI o3-mini. Эти модели являются свидетельством потенциала ИИ в обеспечении позитивных изменений, предлагая большую доступность и контроль как отдельным лицам, так и организациям, способствуя инновациям и расширяя возможности пользователей для формирования собственной реальности.