OpenAI представила GPT-5.2 с тремя режимами работы

Автор: Veronika Radoslavskaya

Компания OpenAI официально анонсировала выпуск модели GPT-5.2, состоявшийся 11 декабря 2025 года. Эта версия знаменует собой значительный шаг вперед, поскольку она вводит систему из трех вариантов, специально разработанную для решения сложных задач в области профессиональной работы с информацией и автономных агентов. OpenAI позиционирует эту серию как свою самую мощную на сегодняшний день, демонстрируя измеримые улучшения в генерации электронных таблиц, создании презентаций, программировании, обработке визуальных данных и рассуждениях в условиях расширенного контекста.

Три специализированных конфигурации

Линейка GPT-5.2 включает три конфигурации: Instant, Thinking и Pro. Каждая из них настроена под определенный уровень сложности и сценарий использования. Модель Instant ориентирована на максимальную скорость при выполнении рутинных запросов, таких как поиск информации, написание текстов и перевод. В то же время, Thinking превосходно справляется со сложными структурированными задачами, включая написание кода, анализ объемных документов, математические вычисления и планирование. Вариант Pro представляет собой высший уровень производительности, нацеленный на обеспечение максимальной точности и надежности при решении наиболее трудных проблем.

Рекордные показатели в тестировании

Модель GPT-5.2 Thinking установила новый эталон, достигнув 100-процентной точности на математическом экзамене AIME 2025 года. Более того, в рамках оценки GDPval, которая измеряет знания в 44 профессиональных областях, модель либо превосходит, либо сравнима с результатами отраслевых экспертов в 70,9% прямых сравнений. Это первый случай, когда модель от OpenAI достигла уровня эксперта в задачах, имеющих высокую экономическую ценность. В сравнительных таблицах OpenAI модель GPT-5.2 Thinking опережает Gemini 3 и Claude Opus 4.5 от Anthropic практически во всех категориях тестов на рассуждение, включая SWE-Bench Pro, GPQA Diamond и наборы ARC-AGI.

Прорывы в программировании

В сфере разработки программного обеспечения, где требуется работа с несколькими языками программирования, GPT-5.2 Thinking продемонстрировала результат 55,6% на тесте SWE-Bench Pro. Это заметно выше показателя GPT-5.1, который составлял 50,8%. Модель также показала 80-процентный результат на верифицированном тесте SWE-bench. Компании-разработчики агентов, такие как Windsurf и CharlieCode, уже отмечают передовую производительность агентов на базе этой модели и ощутимый прирост эффективности в многоэтапных рабочих процессах.

Повышенная надежность и работа с контекстом

Ответы, генерируемые GPT-5.2 Thinking, содержат на 30% меньше ошибок по сравнению с предыдущей версией GPT-5.1, что делает ее более надежным инструментом для ежедневного принятия решений, исследований и создания контента. Модель поддерживает рабочие окна контекста, достигающие сотен тысяч токенов, демонстрируя почти безупречную точность в задачах разрешения кореференции в ходе многораундовых диалогов. Значительно улучшились и возможности обработки изображений: частота ошибок при интерпретации графиков и понимании интерфейсов программного обеспечения сократилась примерно вдвое.

Стратегический контекст выпуска

Этот релиз происходит на фоне обострения конкуренции с Google Gemini 3, который в настоящее время занимает лидирующие позиции на рейтинге LMArena по большинству параметров, за исключением программирования. Ранее в этом месяце генеральный директор Сэм Альтман, по сообщениям, разослал внутреннюю служебную записку с призывом «красного кода», выражая обеспокоенность по поводу снижения трафика ChatGPT и потенциальной потери доли на потребительском рынке в пользу Google. В этой записке подчеркивалась необходимость пересмотра приоритетов, включая отсрочку внедрения рекламы и сосредоточение усилий на создании значительно лучшего пользовательского опыта в ChatGPT.

Доступность и меры безопасности

GPT-5.2 уже развертывается для платных подписчиков ChatGPT (уровни Plus, Pro, Business, Enterprise) и немедленно доступна через API во всех трех конфигурациях. OpenAI также анонсировала новые меры безопасности, касающиеся использования модели в вопросах психического здоровья и верификации возраста для подростков, хотя эти аспекты не получили должного освещения во время основной презентации.

23 Просмотров

Источники

  • OpenAI Blog

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.