今日のニュース内容は「こちらのニュースについて詳しくご紹介します。以下が、注目の「Gemini」新機能7つの内容まとめです」
出典:注目の「Gemini」新機能7つ(エージェントモードから、ささやき声まで)
Google I/O 2025の基調講演は、むしろ「Google AIショー」と呼んだ方が適切だったかもしれません。
同社が発表した内容はほぼすべてがAIを活用したもので、その一部は将来的に提供が約束され、また一部はすでに利用可能となっています。
Googleのさまざまなプロダクトに機能が広がっていますが、その中でも特にみなさんが実際に目にする可能性の高いものをいくつか紹介します。
ニュースサイトで見る:https://www.gizmodo.jp/2025/06/google-_io.html
これは主に、2025年5月に開催されたGoogle I/O 2025で発表されたGeminiに関する新機能について報じられたものです。特に注目されている7つの新機能は、概ね以下のような内容が挙げられます。
- エージェントモード (Agent Mode) / Project Astra (後のGemini Live進化版):
- 単なる会話型AIではなく、ユーザーの指示に基づいて複数のタスクを実行できる自律型AIとしての進化。
- 画面に映るものやカメラ越しの情報も認識し、それに基づいて状況を理解し、タスクをこなす能力。例えば、破損した自転車の修理方法を尋ねると、カメラで自転車の状態を見て指示を出す、といったことが可能になります。
- ウェブサイトの自動操作なども視野に入っています。
- ささやき声への対応 (Native Audio / Expressive Speech):
- より自然な音声対話を実現するため、AIがユーザーのささやき声にも対応し、それに合わせてささやき声で返答する機能。
- 声のトーンや感情を検知して適切に応答する「感情認識対話(Affective Dialogue)」や、バックグラウンドの雑音を無視してスムーズな会話を実現する「プロアクティブ音声(Proactive Audio)」なども関連機能として発表されています。
- Gemini 2.5 Pro DeepThinkモード:
- Gemini 2.5 Proの推論能力をさらに強化したモードで、より複雑で多段階の思考を要するタスクに対応します。
- Googleアプリとの連携強化 (Personal Context / Extensions):
- Gmail、Googleドキュメント、Googleカレンダー、Googleマップなど、既存のGoogleプロダクトとの連携がさらに深まります。
- 例えば、Geminiとの会話内容をそのままGoogleカレンダーの予定として作成したり、Googleマップの情報を基にレストランを提案したりできるようになります。
- ユーザーの個人情報や利用履歴(Google Workspaceデータなど)をGeminiが理解し、よりパーソナライズされた応答やタスク実行が可能になります。
- Gemini in Chrome:
- Google ChromeブラウザにGeminiが統合され、Webページの内容の要約や関連情報の検索などをブラウザ上で行えるようになります。
- Gemini Diffusion:
- 超高速なテキスト生成を可能にする新しい実験モデル。
- Veo 3 (動画生成AI):
- 高品質な動画を生成できるGoogleの新しいAIモデル。
これらの機能は、AIが単なる情報検索ツールから、よりパーソナルでプロアクティブなアシスタントへと進化していく方向性を示しています。特にエージェントモードは、AIがユーザーの代理として様々なタスクを自律的に実行する未来を感じさせるもので、大きな注目を集めています。ただし、一部の機能はまだ実験段階であったり、日本での実装が未定であったりする場合もあります。