谷歌发布 Gemini 2.5 Flash Image,革新 AI 图像生成与编辑体验

编辑者: Veronika Radoslavskaya

谷歌正式推出了其先进的 AI 图像模型 Gemini 2.5 Flash Image,该模型代号为“Nano Banana”,旨在为用户生成和编辑图像的方式带来革命性的变化。此举标志着谷歌在人工智能图像处理领域迈出了重要一步,为创意表达和视觉内容创作开辟了新的可能性。

Gemini 2.5 Flash Image 的核心优势在于其强大的多模态理解能力,能够无缝融合文本和图像信息,实现更精准、更一致的编辑效果。其关键特性包括:多图像融合,允许用户通过自然语言指令将多张图片融合成一张连贯的视觉作品;角色与风格一致性,能够在多次编辑和生成中保持人物、物体或风格的高度一致性;以及精准的自然语言编辑,用户可以通过描述性语言对图像进行精细化、局部化调整,例如改变颜色或移除对象。此外,得益于 Gemini 的高级推理能力和对现实世界的深刻理解,该模型还能处理需要语义理解的任务,如解读手绘图表。

该模型目前已通过 Gemini 应用和 Google AI Studio 向普通用户和开发者开放,同时也可通过 Gemini API 和 Vertex AI 平台进行访问。在定价方面,Gemini 2.5 Flash Image 的输出 token 价格为每 100 万个 token 30 美元,平均每张图像(1024x1024px)约合 0.039 美元,相较于其他领先的 AI 图像生成服务,具有显著的价格优势。

为确保负责任的 AI 使用,谷歌为 Gemini 2.5 Flash Image 的所有输出图像嵌入了可见的“AI”水印以及不可见的数字水印 SynthID,以提高内容的透明度并防止滥用。谷歌还通过严格的安全过滤器和内容策略,致力于阻止有害或不当内容的生成。

市场分析显示,AI 图像生成器市场预计将从 2024 年的 87 亿美元增长至 2030 年的 608 亿美元,年复合增长率高达 38.2%,预示着一个更智能、更高效、更具创造力的视觉内容新时代的到来。

来源

  • Republic World

  • Introducing Gemini 2.5 Flash Image, our state-of-the-art image model

  • Google Gemini’s AI image model gets a ‘bananas’ upgrade

  • Google Gemini 2.5 Flash Image brings a new 'bananas' upgrade to AI image generation

  • Nano banana is here: Google unveils Gemini 2.5 Flash Image upgrade

  • Google’s Gemini 2.5 Flash Image does it all – From blurring backgrounds to multi-image fusion

你发现了错误或不准确的地方吗?

我们会尽快考虑您的意见。