Компания OpenAI анонсировала выпуск GPT-5 Codex, усовершенствованной версии своего ИИ-ассистента для программирования, призванной революционизировать процесс разработки программного обеспечения.
Новая модель демонстрирует значительные улучшения в автоматизации рутинных задач, таких как рефакторинг кода, генерация тестов, исправление ошибок и проведение код-ревью. GPT-5 Codex отличается увеличенной продолжительностью работы, достигающей более семи часов в тестовых сценариях, а также адаптивным управлением вычислительными ресурсами в зависимости от сложности задачи. По сравнению с предыдущими версиями, модель показывает превосходные результаты на стандартных бенчмарках. В частности, на наборе данных SWE-bench Verified GPT-5 Codex достиг точности в 74,5%, превзойдя показатель GPT-5 в 72,8%. В задачах рефакторинга модель продемонстрировала 51,3% успешных операций, что значительно выше 33,9% у GPT-5.
Разработчики высоко оценили возможности GPT-5 Codex в области код-ревью, отмечая меньшее количество неуместных комментариев по сравнению с предыдущей моделью. Доступ к GPT-5 Codex осуществляется через командную строку, расширения для интегрированных сред разработки (IDE), такие как Visual Studio Code, и облачные платформы. Интерфейс командной строки позволяет прикреплять скриншоты или диаграммы для пояснения дизайна, генерировать списки задач и подключаться к внешним инструментам.
Облачная версия предлагает дальнейшую автоматизацию, включая обнаружение скриптов настройки, установку зависимостей и использование браузера для проверки визуального вывода, с возможностью прикрепления скриншотов к задачам или пул-реквестам. GPT-5 Codex интегрирован в различные тарифные планы ChatGPT, включая Plus, Pro, Business, Edu и Enterprise, с возможностью расширенного использования для более высоких уровней подписки. Планируется также выпуск API для интеграции с другими инструментами.
Выпуск GPT-5 Codex знаменует собой важный шаг вперед в практическом применении ИИ в жизненном цикле разработки программного обеспечения. Количественные улучшения в точности и производительности, особенно в рефакторинге и код-ревью, обещают ощутимую пользу для разработчиков. Увеличенная продолжительность работы и адаптивное управление ресурсами решают потенциальные ограничения предыдущих ИИ-моделей при работе со сложными и длительными задачами. Доступность модели в различных средах разработки, от командной строки до облака, способствует ее широкому внедрению.
Планируемая интеграция API станет ключевым следующим шагом, который определит степень расширяемости и интеграции модели в пользовательские рабочие процессы.