Google запускає Gemini 3: Ера «Глибокого мислення» та автономних агентів

18:50, 18 листопада

Автор: Veronika Radoslavskaya

Google запускає Gemini 3

Через два роки після початку буму генеративного штучного інтелекту компанія Google офіційно випустила Gemini 3. Ця модель, як стверджується, має змінити ландшафт ШІ, перетворивши його з чат-ботів, які лише прогнозують текст, на повноцінних агентів, здатних міркувати, планувати та діяти. Реліз передбачає два основні рівні: Gemini 3 Pro, доступний негайно, та значно потужніший режим Gemini 3 Deep Think, розроблений для вирішення складних проблем шляхом «мислення» перед наданням відповіді.

Ключовою особливістю цього покоління є його акцент на «механістичному міркуванні». Негайний запуск Gemini 3 Pro демонструє передові можливості логіки, досягаючи 91.9% у складному тесті GPQA Diamond та 37.5% у Humanity's Last Exam (HLE) без використання додаткових інструментів. Ця здатність дозволяє моделі надійно осягати глибину та нюанси в науці та математиці з високим ступенем достовірності.

Новий режим Deep Think, який незабаром стане доступним для підписників Ultra, розширює ці межі ще далі. Створений для подолання найбільш комплексних і нових проблем, Deep Think показав результат 45.1% на ARC-AGI-2 — суворому тесті, що перевіряє здатність ШІ розв'язувати логічні головоломки, які він ніколи раніше не бачив. Крім того, він досяг 41.0% на HLE. Цей посилений режим призначений для справжнього розв'язання задач, виходячи за рамки стандартного пошуку та синтезу інформації.

Для розробників запуск супроводжується новою платформою під назвою Google Antigravity. Це середовище розробки, орієнтоване на «агентів», дозволяє інженерам-програмістам працювати пліч-о-пліч з агентами ШІ, які мають прямий доступ до терміналів, браузерів та редакторів коду. Замість простого автозавершення рядка коду, ці агенти можуть автономно планувати, виконувати та перевіряти складні програмні завдання. Google описує це як ідеальний інструмент для «вайб-кодування» (vibe coding) — стилю програмування, де розробники зосереджуються на високорівневому творчому задумі, тоді як ШІ бере на себе деталі реалізації.

На споживчому рівні Gemini 3 використовує свої мультимодальні можливості та масивне контекстне вікно на 1 мільйон токенів. Це дозволяє йому обробляти величезні обсяги даних, що еквівалентно понад 1500 сторінкам тексту або цілим відеолекціям. Завдяки цьому він може виступати в ролі персоналізованого тренера: наприклад, модель здатна проаналізувати відео матчу користувача з піклболу, виявити конкретні недоліки у його формі та згенерувати індивідуальний план тренувань.

Для студентів Gemini 3 також є незамінним помічником. Він може поглинати академічні статті або тривалі відеоуроки та створювати інтерактивні навчальні посібники, такі як картки для запам'ятовування (flashcards) або візуалізації, щоб допомогти їм опанувати матеріал. Крім того, модель здатна розшифровувати рукописні рецепти та перетворювати їх на цифрові формати.

Google також заявляє про своє домінування в рейтингах. Gemini 3 Pro вже зайняв перше місце на LMArena — краудсорсинговому сайті для бенчмаркінгу, де користувачі анонімно оцінюють моделі ШІ, досягнувши показника Elo 1501. Миттєве сходження моделі на вершину продовжує спадщину її попередника, Gemini 2.5 Pro, який раніше утримував цей висококонкурентний рейтинг.

Наразі модель поступово впроваджується в екосистему Google, включаючи додаток Gemini, Vertex AI та новий «Режим ШІ» (AI Mode) у Google Search, який створює інтерактивні симуляції на льоту. Хоча режим «Deep Think» поки що притримується для остаточних перевірок безпеки, основна модель Gemini 3 Pro вже доступна сьогодні, сигналізуючи про готовність Google надати «агентний» ШІ в руки мільйонів користувачів.

Gemini