音声会話AI機能「Gemini Live」

Googleは米国現地時間8月13日、Geminiを使ったモバイル音声会話機能であるGemini Liveをリリースしたと発表しました。まずはGemini Advanced加入者のAndroid版で英語のみですが、今後数週間でiOS版や他言語にも展開していくとのことです。

というわけで、Gemini Liveについてご紹介したいと思います。

Googleの発表内容

The KeywordにてGoogleが発表した内容を和訳してご紹介します。

Geminiはモバイルデバイスを強力にAI支援します

私たちは長年、タイマーの設定、音楽の再生、スマートホームの制御にデジタル アシスタントを利用してきました。このテクノロジーにより、作業を簡易化し、日々時短を達成してきました。
また、生成AIにより、複雑な課題に対して全く新しいタイプの支援を提供できるようになりました。これにより、何時間もの時間を節約できるようになりました。Geminiでは、パーソナル アシスタントが本当に役立つとはどういうことか、考察を繰り返しています。そしてGeminiは、より自然で会話的で直感的な新しいレベルの支援を提供するAI搭載のモバイル支援を提供するために進化しています。
AndroidとiOSの両方で利用できる新しいGemini機能について詳しくご説明します。
 

本日リリース: Gemini Live

Gemini Liveは、Geminiと自由に会話できるモバイル会話体験です。自分の能力や学位に適した仕事の可能性についてブレストしてみたいと思いませんか? Geminiとライブで会話して、ぜひ質問してみてください。応答の途中で中断して特定の話題についてさらに深く掘り下げたり、会話を一時停止して戻ったりすることもできます。新しいアイデアについて会話したり、重要な面接の練習をしたりできる相棒がポケットの中にいるようなものです。
Gemini Liveはハンズフリーでもご利用いただけます。バックグラウンドまたは携帯電話がロックされているときでも、Geminiアプリで通話を続けることができるため、通常の電話と同じように、外出先でも会話を続けることができます。Gemini Liveは、AndroidスマートフォンのGemini Advanced加入者向けに英語で本日から提供が開始され、今後数週間でiOSおよび他の言語にも拡大される予定です。
Geminiとの会話がさらに自然に感じられるよう、10種類の新しい音声を導入しました。これにより、自分に最適なトーンとスタイルを選択できます。

 

さらに多くのアプリと接続して日常の助けに

Geminiは、現在使用しているすべてのGoogleアプリやツールと統合することで、大小様々な課題を支援できます。他のアシスタントとは異なり、アプリやサービス間を行き来する必要もありません。
今後数週間で新しい拡張機能をリリース予定で、Keep、タスク、ユーティリティ、YouTube Musicの拡張機能まで及びます。例えば、夕食パーティーを主催するとします。Geminiに、GmailでJennyが送ってくれたラザニアのレシピを取り出し、Keepの買い物リストに材料を追加するよう依頼します。ゲストは大学時代の友人なので、Geminiに「90年代後半を思い出させる曲のプレイリストを作って」と依頼します。あまり細かいことを言わなくても、Geminiはあなたが何を求めているかを大まかに把握して、それを実行するでしょう。
また、近日公開予定のカレンダー拡張機能を使用すると、コンサートのチラシの写真を撮って、その日に空いているかどうかをGeminiに尋ねたり、チケットを購入するリマインダーを設定したりできるようになります。


 

AndroidでGeminiをレベルアップする

GeminiはAndroidユーザー体験に完全統合されており、Androidでのみ可能なコンテキスト認識機能をさらに提供します。Geminiは、Androidスマートフォンで何をしているかに関係なく、必要な時に応じて即座にサポートを提供します。電源ボタンを長押しするか、「Hey Google」と言うだけで、Geminiが表示され、サポートを待機します。「この画面について質問する」という提案をタップすると、画面に表示されている内容に関するヘルプが表示されます。また、YouTubeを使用している場合は、視聴している内容についての質問をすることもできます。海外旅行の準備をしていて、旅行のVlogを見たばかりだとします。「この動画について質問する」をタップして、動画で紹介されている全レストランのリストを作ってもらい、GeminiにそれらのレストランをGoogleマップへ追加してもらうこともできます。
GeminiのAndroidとの完全統合を活かして、画面の読み取り以上のことも可能です。すでに使用している多くのアプリともやり取りできます。例えば、Geminiが生成した画像をGmailやGoogleメッセージなどのアプリに直接ドラッグ&ドロップで併用することが可能です。


 

役に立つ支援を熟考し続ける

Geminiアプリはリリースされてからまだ1年も経っていませんが、買い物リストの更新、メールの下書き、さらには今後の就職面接のリハーサルなどにも役立ち、すでに時短を達成しています。
AIは強力な新機能を実現する一方で、新たな課題も生み出します。皮肉なことに、自然言語をより適切に解釈し、複雑な課題を処理できる大規模な言語モデルを使用すると、むしろ単純な課題の完了に少し時間がかかることがよくあります。また、生成AIは幅広く課題を完了できるほど柔軟ですが、予期しない動作をしたり、不正確な情報を提供したりすることだってあります。
この問題に対処するため、より高速で高品質の応答を提供するGemini 1.5 Flashなどの新しいモデルを導入しました。今後数ヶ月間、引き続き速度と品質に注力し、Google Home、電話、メッセージとのより緊密な統合を開始します。今後の改善点の詳細など、お気に入りのアシスタント アクションの全てにおいてGeminiがどのように役立つかについては、こちらをご覧ください。

この度、私たちは従来の技術で課題解決するよりもAI搭載アシスタントの有用性のほうがをはるかに上回ると確信できるようになりました。Google Pixel 9のデフォルト アシスタントとしてGeminiを試していただけることを嬉しく思います。私たちはAI搭載アシスタントが役立つあらゆる方法を発見する初期段階にあり、Pixelスマートフォンと同様、Geminiは今後もさらに進化していきます。

引用)The Keyword

 

Andoroidにガッツリ備わっているようで、様々なアプリに連携し、何かあったらすぐにGeminiを起動していつでも質問や会話ができるようになるとのことです。保守的な人には怖く感じるかもしれませんが、先進的な人には楽しくてしかたないかもしれませんね(笑)。
機能としては、OpenAIのGPT-4oをベースとしたadvanced Voice Modeと同じかと思いますが、Googleの各製品やアプリとの連携が可能な分、可用性は高いかと思います。

Gemini Liveでは会話相手として10種類の声から選択でき、ハンズフリーで会話でき(つまりイヤホンで会話できる)、今後はもっとGoogle Pixelや各アプリとの連携や複雑な組み合わせを可能としていくようです。
 

まぁ…いよいよ歩きながら独り言を言う人が増えてくるってことですね(笑)。

カテゴリー

新着記事

人気記事

過去記事