OpenAIは、最先端のAI動画および音声生成モデルであるSora 2を発表しました。この新しいモデルは、物理的な正確さ、リアリズム、そして制御性の向上を特徴としており、前モデルから大幅な進化を遂げています。特に、同期された対話と効果音を生成する能力は、より没入感のあるコンテンツ制作を可能にします。生成される動画の長さは最大16秒に達し、リアル、シネマティック、アニメなど、さまざまな視覚スタイルをサポートしています。
Sora 2のアプリは現在、招待制でiOSデバイス向けに提供されており、米国とカナダで段階的に展開されています。パーソナライズされた「カメオ」を作成するには、ユーザーは一度だけ自身の動画と音声を提供し、本人確認を行う必要があります。ユーザーの肖像を使用して作成された各動画には、そのユーザーの同意が必要となります。OpenAIは、孤立、依存、低品質コンテンツの拡散といった潜在的な安全上の懸念に対処するため、人間のモデレーターによる監視を含む安全対策を導入しています。また、コンテンツの出所を確認するため、すべてのSora動画に目に見える透かしとC2PAメタデータを追加しています。
Sora 2は、2024年2月にリリースされたオリジナルのSoraモデルを基盤としています。オリジナルのSoraは、AIによる動画生成の可能性を示しましたが、複雑な物理的相互作用のシミュレーションや一貫した世界状態の維持には課題がありました。Sora 2はこれらの限界に対処し、より現実に即した動画生成を実現しています。例えば、バスケットボール選手がシュートを外した場合、Sora 2ではボールがバックボードに跳ね返る様子がより忠実に再現されます。
この新しい技術は、クリエイティブ産業に新たな可能性をもたらします。AIによる動画生成市場は、2030年までに約19億ドルから23億ドル規模に成長すると予測されており、Sora 2のような先進的なツールは、この成長をさらに加速させるでしょう。広告や映画制作といった分野では、制作コストの削減と効率化が期待される一方で、コンテンツ制作のあり方そのものに変革をもたらす可能性も秘めています。
OpenAIは、Sora 2の展開において、倫理的な側面にも配慮しています。著作権侵害を防ぐためのフィルタリング機能や、ユーザーの肖像権を保護するための同意に基づくライクネスの使用、そして若年ユーザー向けの保護措置などが講じられています。これにより、技術の進化と同時に、安全で責任ある利用環境の構築を目指しています。将来的には、APIを通じた提供も予定されており、より広範な開発者や企業がこの技術を活用できるようになる見込みです。