Google випускає Gemini 2.5 Flash Image: нова ера генерації зображень

11:05, 03 жовтня

Відредаговано: gaya ❤️ one

Компанія Google офіційно представила Gemini 2.5 Flash Image, передову модель штучного інтелекту для створення та редагування зображень, яка тепер загальнодоступна для розробників та підприємств. Цей інструмент, анонсований 2 жовтня 2025 року, доступний через Gemini API, Google AI Studio та Vertex AI.

Модель підтримує 10 різних співвідношень сторін, що дозволяє створювати контент для різноманітних платформ. Ключовим вдосконаленням є покращена консистентність персонажів, що дозволяє зберігати їхню подобу при значних редагуваннях. Gemini 2.5 Flash Image також має нативну мультимодальну здатність, обробляючи текст та зображення одночасно для більш точного та послідовного редагування. Вартість становить 0,039 долара за зображення та 30 доларів за мільйон вихідних токенів.

Стартап у сфері ШІ Cartwheel, в особі співзасновника Ендрю Карра, відзначив, що модель ефективно справляється зі складними позами з будь-якого ракурсу. Це свідчить про глибше розуміння моделлю контексту та взаємозв'язків у зображеннях. Цей запуск є стратегічною відповіддю на конкурентний ринок, який загострився завдяки інтеграції OpenAI свого генератора зображень GPT-4o в ChatGPT. Google прагне до масового впровадження, орієнтуючись на широку аудиторію безпосередньо у своєму чат-додатку.

Щоб боротися з діпфейками, Google впроваджує видимі та невидимі водяні знаки SynthID на весь згенерований контент, чітко вказуючи на походження ШІ. Ця технологія розроблена Google DeepMind, що відрізняє її підхід від конкурентів, які стикаються з судовим позовом щодо авторських прав. Інтегруючи зручні інструменти редагування у свій флагманський продукт ШІ, Google позиціонує Gemini як комплексний творчий двигун. Запровадження SynthID є важливим кроком для забезпечення прозорості та боротьби з дезінформацією.

Джерела

WinBuzzer
Gemini Flash - Google DeepMind
Introducing Gemini 2.5 Flash Image, our state-of-the-art image model
Building next-gen visuals with Gemini 2.5 Flash Image (aka nano-banana) on Vertex AI
Google I/O 2025: Updates to Gemini 2.5 from Google DeepMind
Release notes | Gemini API | Google AI for Developers

Читайте більше новин на цю тему:

21 листопада

Браузер Perplexity Comet, орієнтований на ШІ, нарешті з'явився на Android

19 листопада

Google Представила Gemini 3: Інтеграція в Пошук та Агентні Можливості

17 листопада

X Запускає 'Chat' – Нову Платформу для Зашифрованих Повідомлень та Дзвінків

Знайшли помилку чи неточність?

Ми розглянемо ваші коментарі якомога швидше.

Центр сповіщень

Центр сповіщень

Google випускає Gemini 2.5 Flash Image: нова ера генерації зображень

Джерела

Читайте більше новин на цю тему: