音楽生成AI × Gemini API

今回のニュース内容は「Googleは2025年5月のGoogle I/Oイベントで、「Lyria RealTime(リリア・リアルタイム)」という新しい音楽生成AIモデルを発表しました。これは、開発者向けのGemini APIおよびGoogle AI Studioで利用可能となっています。」

出典:Gemini API は Lyria RealTime を使用して、最先端のリアルタイム ストリーミング音楽生成モデルにアクセスできます。これにより、デベロッパーは、ユーザーがテキスト プロンプトを使用して楽器の音楽をインタラクティブに作成、継続的に操作、演奏できるアプリを構築できます。
https://ai.google.dev/gemini-api/docs/music-generation?hl=ja

このニュースの主なポイントは以下の通りです。

  • リアルタイム音楽生成: Lyria RealTimeは、ユーザーがテキストプロンプトを使って、インタラクティブにリアルタイムでインストゥルメンタル音楽を作成、制御、演奏できるモデルです。WebSocketを使用して、低遅延のストリーミング接続で音楽を生成します。
  • 開発者向けAPI: Gemini APIを通じてLyria RealTimeを利用できるため、開発者は自身のアプリケーションに音楽生成機能を組み込むことができます。
  • プロンプトによる制御: ムード、ジャンル、楽器などを記述したテキストプロンプトを送信することで、生成される音楽をコントロールできます。プロンプトの重みを調整して、音楽の変化に影響を与えることも可能です。
  • 出力形式: 16ビットPCM音声、48 kHzサンプルレート、ステレオチャンネルで出力されます。
  • 制限事項: 現時点ではインストゥルメンタル音楽のみの生成であり、安全性フィルタによってプロンプトがチェックされます。また、責任あるAIの原則に基づき、生成された音声には常に識別用の透かしが入ります。
  • Google I/O 2025での発表: この機能は、Google I/O 2025で発表された、Gemini APIの様々な新機能や強化の一部として紹介されました。

この機能は、音楽制作、ゲーム開発、インタラクティブアートなど、様々な分野で新しいクリエイティブな体験を生み出す可能性を秘めています。

📝 まとめ

  1. テキストだけで音楽が作れる時代に。Gemini APIで手軽に体験してみましょう。
  2. 難しい知識は不要。Geminiが音楽づくりをもっと身近にしてくれます。
  3. AIと一緒に音楽を楽しむ、新しい扉が開かれました。
  4. これからは「ひらめき」だけで、あなたも作曲家に。
  5. GoogleのAI技術で、音楽の世界がもっと自由になります。

関連記事

TOP