谷歌发布 Gemini 2.5 Flash Image，革新 AI 图像生成与编辑体验

09:26, 27 八月

编辑者： Veronika Radoslavskaya

谷歌正式推出了其先进的 AI 图像模型 Gemini 2.5 Flash Image，该模型代号为“Nano Banana”，旨在为用户生成和编辑图像的方式带来革命性的变化。此举标志着谷歌在人工智能图像处理领域迈出了重要一步，为创意表达和视觉内容创作开辟了新的可能性。

Gemini 2.5 Flash Image 的核心优势在于其强大的多模态理解能力，能够无缝融合文本和图像信息，实现更精准、更一致的编辑效果。其关键特性包括：多图像融合，允许用户通过自然语言指令将多张图片融合成一张连贯的视觉作品；角色与风格一致性，能够在多次编辑和生成中保持人物、物体或风格的高度一致性；以及精准的自然语言编辑，用户可以通过描述性语言对图像进行精细化、局部化调整，例如改变颜色或移除对象。此外，得益于 Gemini 的高级推理能力和对现实世界的深刻理解，该模型还能处理需要语义理解的任务，如解读手绘图表。

该模型目前已通过 Gemini 应用和 Google AI Studio 向普通用户和开发者开放，同时也可通过 Gemini API 和 Vertex AI 平台进行访问。在定价方面，Gemini 2.5 Flash Image 的输出 token 价格为每 100 万个 token 30 美元，平均每张图像（1024x1024px）约合 0.039 美元，相较于其他领先的 AI 图像生成服务，具有显著的价格优势。

为确保负责任的 AI 使用，谷歌为 Gemini 2.5 Flash Image 的所有输出图像嵌入了可见的“AI”水印以及不可见的数字水印 SynthID，以提高内容的透明度并防止滥用。谷歌还通过严格的安全过滤器和内容策略，致力于阻止有害或不当内容的生成。

市场分析显示，AI 图像生成器市场预计将从 2024 年的 87 亿美元增长至 2030 年的 608 亿美元，年复合增长率高达 38.2%，预示着一个更智能、更高效、更具创造力的视觉内容新时代的到来。

来源

Republic World
Introducing Gemini 2.5 Flash Image, our state-of-the-art image model
Google Gemini’s AI image model gets a ‘bananas’ upgrade
Google Gemini 2.5 Flash Image brings a new 'bananas' upgrade to AI image generation
Nano banana is here: Google unveils Gemini 2.5 Flash Image upgrade
Google’s Gemini 2.5 Flash Image does it all – From blurring backgrounds to multi-image fusion

通知中心

谷歌发布 Gemini 2.5 Flash Image，革新 AI 图像生成与编辑体验

来源

阅读更多关于该主题的新闻：