Googleが「Lyria 3」を発表:Geminiに直接統合されたAI音楽制作スタジオ

作者: Veronika Radoslavskaya

2026年2月18日、Google DeepMindは、同社がこれまでに開発した中で最も先進的な音楽生成モデルである「Lyria 3」のグローバル展開を正式に発表しました。この最新ツールは、これまでの研究段階のプレビュー版を脱し、Geminiのウェブインターフェースおよびモバイルアプリを通じて、世界中のユーザーが直接利用できるようになっています。

今回のアップデートにより、AIチャットボットであるGeminiは、単なる対話型AIを超えて、包括的な音楽制作スタジオへとその姿を変えました。ユーザーは専門的な知識がなくても、直感的な操作で高品質な楽曲を制作することが可能になります。

Lyria 3は、従来の実験的なバージョンと比較して、その機能を大幅に拡張させています。特に注目すべきは、マルチモーダル入力への対応、歌詞とボーカルの生成、そして制作過程における詳細なコントロール機能の3点です。

  • マルチモーダル入力:ユーザーはテキストによる指示だけでなく、写真や動画をアップロードして音楽を生成することができます。例えば、雨の降る街角の動画をスキャンして、その視覚的なリズムや情緒に合致するローファイ・ジャズを制作するといった活用が可能です。
  • 歌詞とボーカルの生成:以前のモデルとは異なり、Lyria 3は歌詞の執筆からボーカルパフォーマンスの生成までをこなします。現在、日本語、英語、スペイン語、韓国語、ヒンディー語を含む8言語のボーカルに対応しており、アラビア語もベータ版として提供されています。
  • 詳細なコントロール:新しいインターフェースでは、テンポやジャンルのスタイル、楽器の「密度」などを細かく調整できるコントロール機能が備わっています。生成されるのは高品質な30秒のクリップですが、これらはシームレスに延長したり、ループさせたりすることが可能です。

クリエイティブなパッケージをより完璧なものにするため、Googleは最新の画像生成モデルをこのシステムに統合しました。このモデルは内部で「Nano Banana」というコードネームで呼ばれており、Gemini 2.5 Flash Imageファミリーの一環として開発されたものです。

このシステムは、生成された楽曲の歌詞や雰囲気を自動的に分析し、それぞれの曲に合わせた独自の高品質なアルバムアートワークを制作します。これにより、音楽制作からビジュアルの作成までを一つのプラットフォームで完結させることができます。

Googleは、Lyria 3の開発において、著作権の保護とアーティストの安全性を厳格に遵守したことを強調しています。AI技術の進歩に伴う倫理的な懸念に対し、複数の強力な保護策が講じられています。

その一つが「アンチ・ミミクリー(模倣防止)」のガードレールです。このモデルは、特定のアーティストを模倣するようなプロンプトを拒否するように設計されています。例えば「テイラー・スウィフトのようなスタイルで」という要求に対しては、広範な創造的インスピレーションとしてのみクエリを使用し、アーティストの声や特徴的なメロディ構造を複製しないよう徹底されています。

また、すべてのオーディオ出力には「SynthID」が埋め込まれています。これは人間の耳には聞こえない電子透かしであり、音声が圧縮、編集、あるいはミックスされた後でも検出可能です。これにより、AIによって生成されたコンテンツであることを常に識別できる仕組みとなっています。

この新機能は、本日より世界中の18歳以上のGeminiユーザーに向けて順次ロールアウトが開始されました。Googleはこのリリースを、SunoやUdioといった既存の音楽生成サービスに対する直接的な競合と位置づけています。

Googleは自社の広大なエコシステムとの統合を最大限に活用し、高度な音楽制作ツールを大衆へと普及させることを狙っています。今回のLyria 3の公開は、AIを活用したクリエイティビティの新たな標準を確立するものとなるでしょう。

今後、Googleはユーザーからのフィードバックを基に、さらなる言語の追加や機能の拡張を予定しています。Lyria 3の登場は、音楽制作の敷居を下げ、世界中のクリエイターに新たな表現の可能性を提供することになるでしょう。

9 ビュー

ソース元

  • Google DeepMind

エラーや不正確な情報を見つけましたか?できるだけ早くコメントを考慮します。