Google、革新的な画像生成AI「Gemini 2.5 Flash Image」を発表

編集者: gaya ❤️ one

Googleは2025年10月2日、高度な画像生成および編集能力を持つAIモデル「Gemini 2.5 Flash Image」を発表しました。このプロダクションレディなツールは、開発者や企業が世界中で利用可能となり、Gemini API、Google AI Studio、Vertex AIを通じて提供されます。このリリースは、ビジュアルコンテンツ制作における先進的なAI技術へのアクセスを民主化する重要な一歩となります。

Gemini 2.5 Flash Imageは、クリエイティブプロセスを洗練させるための数々の機能強化を導入しています。10種類の異なるアスペクト比をサポートし、映画のようなディスプレイから縦長のソーシャルメディアフォーマットまで、幅広いプラットフォームに対応します。特に注目すべきは、編集プロセス全体を通じて被写体の類似性を維持する、改良されたキャラクターの一貫性です。これは、AIによる画像生成における長年の課題に対処するものです。さらに、Gemini 2.5 Flash Imageはネイティブなマルチモーダル機能を備えており、テキストと画像の入力を同時に処理することで、より正確で統一感のある編集を実現します。

この新しいモデルは、Googleの既存のチャットアプリケーションに統合されることで、広範な普及を目指しています。AIスタートアップのCartwheelの共同創設者であるアンドリュー・カーは、Gemini 2.5 Flash Imageがどのようなカメラアングルからでも複雑なポーズを処理する能力に優れており、ポーズへの忠実さと「ワールドナレッジ」の両方を提供できると評価しています。この高度な理解力により、よりニュアンスに富んだ、文脈を考慮した画像操作が可能になります。

不正なディープフェイクの拡散に対抗し、信頼を醸成するため、Googleは生成されたすべてのコンテンツに、Google DeepMindによって開発された、目に見えるものと目に見えないものの両方のSynthIDウォーターマークを実装します。これにより、画像のAI生成元であることが明確に示され、デジタル空間における透明性を促進するための重要な措置となります。これは、Midjourneyのような競合他社が現在、注目度の高い著作権訴訟に関与している状況とは対照的です。

Gemini 2.5 Flash Imageは、画像あたり0.039ドル、出力トークン100万あたり30ドルという競争力のある価格設定で提供され、Vertex AIを通じたエンタープライズ導入を促進する戦略が取られています。Googleの主要なAI製品に直接、ユーザーフレンドリーな編集ツールが統合されたことは、ダイナミックな生成AI分野において、高度なクリエイティブ能力を一般ユーザーにアクセス可能で信頼性の高いものにするというコミットメントを示しています。

AI画像生成ツールの影響は、クリエイティブ産業を根本的に変革しており、効率性の向上と芸術的表現の新たな道を提供しています。Gemini 2.5 Flash Imageのようなツールは、デザイナー、マーケター、アーティストが迅速に反復処理を行い、型破りなスタイルを探求し、抽象的な概念を視覚化することを可能にし、想像力の限界を押し広げています。AIが進化し続けるにつれて、クリエイティブプロセスにおける共同パートナーとしての役割はますます重要になり、前例のないイノベーションの時代を約束しています。

ソース元

  • WinBuzzer

  • Gemini Flash - Google DeepMind

  • Introducing Gemini 2.5 Flash Image, our state-of-the-art image model

  • Building next-gen visuals with Gemini 2.5 Flash Image (aka nano-banana) on Vertex AI

  • Google I/O 2025: Updates to Gemini 2.5 from Google DeepMind

  • Release notes | Gemini API | Google AI for Developers

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。