Google представляет Gemini 2.5 Flash Image: новый этап в генерации изображений

11:05, 03 октября

Отредактировано: gaya ❤️ one

Компания Google официально представила Gemini 2.5 Flash Image, передовую модель искусственного интеллекта для создания и редактирования изображений, объявлена 2 октября 2025 года и доступна для промышленного применения. Инструмент доступен через API Gemini, Google AI Studio и Vertex AI, открывая новые возможности для креативных индустрий.

Gemini 2.5 Flash Image поддерживает 10 различных соотношений сторон, что позволяет создавать контент для разнообразных платформ, от широкоформатных пейзажей до вертикальных форматов для социальных сетей. Одно из ключевых улучшений — повышенная согласованность персонажей, позволяющая сохранять их узнаваемость при внесении значительных правок. Модель обладает нативной мультимодальной функциональностью, обрабатывая текст и изображения одновременно для более точного редактирования.

Ценовая политика ориентирована на корпоративный сегмент через Vertex AI: стоимость составляет 0,039 доллара за изображение и 30 долларов за миллион выходных токенов. Ранние пользователи, такие как стартап Cartwheel, в лице соучредителя Эндрю Карра, отметили способность модели работать со сложными позами под любым углом камеры, подчеркивая ее точность и «знание мира».

Выпуск Gemini 2.5 Flash Image является ответом Google на растущую конкуренцию, в частности, на фоне интеграции генератора изображений GPT-4o от OpenAI в ChatGPT. Google стремится к массовому внедрению, делая ставку на доступность и доверие, стремясь через прямое таргетирование в чат-приложениях привлечь массовый рынок. Для борьбы с дипфейками Google внедряет видимые и невидимые водяные знаки SynthID на весь сгенерированный контент. Эта технология разработана Google DeepMind, что отличает ее подход от конкурентов, которые сталкиваются с судебными исками по авторским правам.

Интегрируя интуитивно понятные инструменты редактирования в существующее чат-приложение Google, Gemini позиционируется как комплексный творческий инструмент. Способность модели понимать и воплощать сложные визуальные концепции, сохраняя целостность и узнаваемость, открывает новые возможности для художников, дизайнеров и создателей контента по всему миру.

Источники

WinBuzzer
Gemini Flash - Google DeepMind
Introducing Gemini 2.5 Flash Image, our state-of-the-art image model
Building next-gen visuals with Gemini 2.5 Flash Image (aka nano-banana) on Vertex AI
Google I/O 2025: Updates to Gemini 2.5 from Google DeepMind
Release notes | Gemini API | Google AI for Developers

Читайте больше новостей по этой теме:

21 ноября

Perplexity Comet на Android: интернет управляется голосом

19 ноября

Google представила Gemini 3: Интеграция в Поиск и Начало Эпохи Агентного ИИ

17 ноября

X Представляет «Chat»: Новая Платформа для Зашифрованного Обмена Сообщениями и Звонков

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.

Центр уведомлений

Центр уведомлений

Google представляет Gemini 2.5 Flash Image: новый этап в генерации изображений

Источники

Читайте больше новостей по этой теме: