Компания Google официально представила Gemini 2.5 Flash Image, передовую модель искусственного интеллекта для создания и редактирования изображений, объявлена 2 октября 2025 года и доступна для промышленного применения. Инструмент доступен через API Gemini, Google AI Studio и Vertex AI, открывая новые возможности для креативных индустрий.
Gemini 2.5 Flash Image поддерживает 10 различных соотношений сторон, что позволяет создавать контент для разнообразных платформ, от широкоформатных пейзажей до вертикальных форматов для социальных сетей. Одно из ключевых улучшений — повышенная согласованность персонажей, позволяющая сохранять их узнаваемость при внесении значительных правок. Модель обладает нативной мультимодальной функциональностью, обрабатывая текст и изображения одновременно для более точного редактирования.
Ценовая политика ориентирована на корпоративный сегмент через Vertex AI: стоимость составляет 0,039 доллара за изображение и 30 долларов за миллион выходных токенов. Ранние пользователи, такие как стартап Cartwheel, в лице соучредителя Эндрю Карра, отметили способность модели работать со сложными позами под любым углом камеры, подчеркивая ее точность и «знание мира».
Выпуск Gemini 2.5 Flash Image является ответом Google на растущую конкуренцию, в частности, на фоне интеграции генератора изображений GPT-4o от OpenAI в ChatGPT. Google стремится к массовому внедрению, делая ставку на доступность и доверие, стремясь через прямое таргетирование в чат-приложениях привлечь массовый рынок. Для борьбы с дипфейками Google внедряет видимые и невидимые водяные знаки SynthID на весь сгенерированный контент. Эта технология разработана Google DeepMind, что отличает ее подход от конкурентов, которые сталкиваются с судебными исками по авторским правам.
Интегрируя интуитивно понятные инструменты редактирования в существующее чат-приложение Google, Gemini позиционируется как комплексный творческий инструмент. Способность модели понимать и воплощать сложные визуальные концепции, сохраняя целостность и узнаваемость, открывает новые возможности для художников, дизайнеров и создателей контента по всему миру.