Google、画像生成・編集の新時代を切り拓く「Gemini 2.5 Flash Image」を発表

編集者: Veronika Radoslavskaya

Googleは、画像生成および編集のための先進的なAIモデル「Gemini 2.5 Flash Image」を正式に発表しました。このモデルは「ナノバナナ」というコードネームで知られ、従来のAI画像編集の限界を克服し、ユーザーに写真編集に対するより高度な制御を提供することを目指しています。

Gemini 2.5 Flash Imageの主な特徴として、複数の画像を一つに融合させる「マルチイメージフュージョン」や、様々な編集を通じて被写体の特徴を一貫して維持する「キャラクター・スタイルの一貫性」が挙げられます。さらに、自然言語による指示で的確な変換を行う「ターゲット変換」や、広範な「ワールドナレッジ」を活用した、より深く関連性の高い画像生成もサポートしています。

この新しいモデルは、Geminiアプリを通じて無料ユーザーおよび有料ユーザーが利用できるほか、開発者にはGemini API、Google AI Studio、Vertex AIを通じて提供されます。開発者向けの料金は、出力トークン100万件あたり30ドル、画像あたり約0.039ドルと設定されています。

悪用を防ぐための安全対策として、Googleは生成または編集されたすべての画像に、視覚的に確認できる透かしと、目に見えないデジタルタグであるSynthIDを実装しています。この発表により、Googleは精密かつユーザーフレンドリーなツール群で、AI画像編集市場におけるその地位を一層強固なものにしました。

Gemini 2.5 Flash Imageは、単なる画像生成ツールにとどまらず、クリエイティブなワークフローを根本から変革する可能性を秘めています。例えば、複数の画像をシームレスに組み合わせることで、現実には存在しないシーンを創り出したり、特定のキャラクターやスタイルを一貫して維持することで、物語性のあるビジュアルコンテンツ制作を容易にします。また、自然言語による直感的な編集機能は、専門的なスキルを持たないユーザーでも、まるで対話するように画像を思い通りに加工することを可能にします。

さらに、Gemini 2.5 Flash Imageは、Googleの持つ広範な知識基盤を活用することで、単なる写実的な画像生成を超えた、より深い意味理解に基づいた画像生成を実現します。これにより、教育分野での図解の解釈や、複雑な指示に基づいた画像編集など、高度な応用が可能になります。これらの機能は、AI技術がクリエイティブ産業に与える影響の大きさと、その進化の速さを改めて示しています。Googleは、この技術を通じて、より多くの人々が創造性を発揮できる環境を提供することを目指しています。

ソース元

  • Republic World

  • Introducing Gemini 2.5 Flash Image, our state-of-the-art image model

  • Google Gemini’s AI image model gets a ‘bananas’ upgrade

  • Google Gemini 2.5 Flash Image brings a new 'bananas' upgrade to AI image generation

  • Nano banana is here: Google unveils Gemini 2.5 Flash Image upgrade

  • Google’s Gemini 2.5 Flash Image does it all – From blurring backgrounds to multi-image fusion

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。