日本語対応!Gemini Liveの新機能でより多彩なコンテンツ活用が可能に

今回のニュース内容は、「Google の AI アシスタントである Gemini Live が大幅に機能拡張され、画像、ファイル、YouTube 動画の内容について、日本語を含む複数の言語で自然な会話ができるようになったことを伝えるものです。」

出典:タイトル「Gemini Live の「これについて Live で話す」が画像、ファイル、YouTube に対応。日本語も利用可」

これまでこの機能は、会話ベースのやり取りに限定されていましたが、今回のアップデートにより、以下のようなコンテンツについてもリアルタイムで Gemini と対話できるようになっています。

画像:カメラで撮影した写真やギャラリー内の画像を対象に利用可能。ただしスクリーンショットには非対応。
ファイル:TXT / DOC / PDF などの文書ファイルをアップロードし、その内容について質問可能。
YouTube 動画:動画の URL を貼り付けるか、再生中に Gemini を起動することで、字幕に基づいた質問が可能(2時間以内の動画が対象)。

https://helentech.jp/news-63948/

主なポイント:

「これについて Live で話す」機能の拡張: 以前から提供されていた Gemini Live の会話機能が進化し、ユーザーがアップロードした画像やファイル、共有した YouTube 動画の内容をコンテキストとして理解し、それについて自然な音声会話ができるようになりました。

対応コンテンツ:コンテンツについては、上記に記載しているので、こちらでは省きます。

日本語を含む多言語対応: Gemini Live は日本語を含む複数の言語に対応しており、自然な日本語での会話が可能です。最大2つの言語を設定して使用できます。
利用方法: Gemini モバイルアプリから「Live」をタップするか、「OK Google, Live で話そう」などの音声コマンドで起動できます。画像やファイルについては、アプリ内の「ファイルを追加」ボタンからアップロードします。YouTube については、YouTube アプリから連携できます。
提供状況: この機能は、一部の Android デバイスとアカウントで利用可能になっており、順次拡大されています。

このアップデートの意義:

この機能拡張により、Gemini Live はより多様な状況でユーザーのサポートが可能になります。例えば、

  • 旅行先で見た風景の写真をアップロードして、その場所の名前や歴史について尋ねる。
  • 会議資料の PDF をアップロードして、内容の要約や不明な点を質問する。
  • 興味のある YouTube 動画について、さらに詳しい情報を引き出す。
  • 外国語の画像やドキュメントについて、日本語で説明を受ける。
    など、様々な活用が期待されます。

まとめ

「Gemini Live の『これについて Live で話す』」機能が、画像、ファイル、YouTube に対応したというニュースは、Geminiが機能を強化していることを示していますね。Gemini Liveは、ユーザーがライブセッションを通じてAIに質問や指示を与える機能ですが、これがさらに進化し、画像やファイル、YouTubeのコンテンツを扱えるようになったということです。

特に日本語にも対応する点は、より多くのユーザーが活用できるようになる大きなポイントです。これによって、視覚的なコンテンツや動画を元にした会話やフィードバックが可能になるため、AIとのインタラクションの幅が広がりますね。特にYouTubeの動画を直接取り扱えるようになれば、情報提供や学習のための新しい可能性も生まれそうです。

この機能をアフィリエイトの活用やコンテンツ制作にどう生かせるか、いろいろ考えると面白いですね。

※私もこのブログで、将来「動画配信が出来れば」と思っています(生きている間に出来ればいいのだが・・・)。

関連記事

TOP