Bardがパワーアップ

Googleは米国現地時間6月7日、The KeywordにてBardの機能がアップデートされた旨を発表しました。“implicit code execution(暗黙的なコード実行)”と呼ぶ機能を差し込むことで、数学的な要素や文字列への理解を高めることができたようです。元記事を和訳しながらご紹介します。

右脳と左脳の融合…的な

今までのBardが使用していたLLM(大規模言語モデル)は文章から定性的に導き出した、直感的な回答が主でした。というかそれだけでした。そのせいで、複雑な計算式でも直感的な解釈でテキトーに答えを出していたようです。でも、実際の人間もそうであるように、回答には右脳と左脳と言いますか…直感で回答するものと計算して回答するものと両方ありますよね。もっと言えば、答えのないものと答えのあるもの…つまり、感性や見解に委ねられる答えと数式的な(答えが決まっている)答えと両方あると思います。

今回Bardでは、上記で言うところの直感性の高い思考をシステム1と定義し、計算式による思考をシステム2と定義しています。そのうえで、システム2の思考をBardに導入することで、数学の問題やコーディング要件、文字列の解釈等の能力が劇的に向上したとのことです。実際には、プロンプトに対する回答精度が約30%上昇したとのことです。

Bardの論理力と推理力が向上

implicit code execution(暗黙的なコード実行)と呼ばれる新しい技術によって、Bardの数学的なタスク、コーディングの質問、文字列操作の能力が向上した他、Googleスプレッドシートへの新たなエクスポート機能が追加されるようになりました。

本日、Bardの2つの改良点を発表します。まず、Bardは数学的なタスク、コーディングの質問、文字列操作の能力が強化されました。そして、Googleスプレッドシートへの新しいエクスポート機能が追加されました。例えば「動物保護施設のボランティア登録のための表を作成してください」と依頼すると、Bardが回答として表を作成しますが、その表をGoogleスプレッドシートに直接エクスポートできるようになりました。
 

高度な推論や数学のプロンプトへの対応力が向上

“implicit code execution”と呼ばれる新しい技術によって、Bardが計算プロンプトを検出しバックグラウンドでコードを実行するようになります。その結果、数学的なタスク、コーディングの質問、文字列操作のプロンプトに対して、より正確に回答できるようになりました。例えば、Bardは次のようなプロンプトに適切に回答できます:
 

  • 15683615の素因数は何ですか。
  • 私の貯蓄の成長率を計算してください。
  • “Lollipop”という単語を逆さまにしてください。

 

この新機能がBardの回答力向上にどのように役立っているのか、詳しく解説します。
 

論理的思考力・推理力の向上

大規模言語モデル(LLM)は予測エンジンのようなもので、プロンプトが与えられると次に来るであろう単語を予測して応答を生成します。そのためLLMは言語や創造的なタスクには非常に優れていますが、一方で推論や数学などの分野には弱かったのです。高度な推論や論理の能力を持ち、より複雑な問題の解決ができるようになるには、LLMによるアウトプットだけでは充分ではありません。

そこで今回新しく追加した方法は、Bardにコードを生成し実行させることで、推論や数学の能力を高めるようにするというものです。この考え方は、心理学者のダニエル・カーネマンの著書『Thinking, Fast and Slow』に代表される、人間の知能における“システム1”と“システム2”という二項対立から着想を得ました。
 

  • System 1 thinking(システム1の思考)は、高速で直感的で、理屈で考える程の思考を必要としません。ジャズミュージシャンがその場で即興演奏したり、ブラインドタッチをすることはこのシステム1の思考と同じような思考感覚だと思います。
  • System 2 thinking(システム2の思考)は、ゆっくりじっくりと労力をかけて計算的に思考するものです。長くて複雑な割り算をする時や楽器の演奏方法を学ぶ時は、システム2の思考と同じような思考感覚だと思います。

 

このように考えると、LLMは純粋にシステム1の思考で動いていると考えることができ、テキストを素早く作成することはできますが、一方で深く計算して考えるようなことはありません。そのため、驚くような能力を発揮することもありますが、思いもよらない場面で失敗することもあります(例えば、システム1の思考だけで数学の問題を解こうとする場面を想像してください:一度振り返って計算することができず、直感的に頭に浮かんだ最初の答えを吐き出すしかないのです)。実際の計算を行う際にはシステム2の思考と密接に関連しており、それは形式的で柔軟性や創造性に欠けますが、正しい手順を踏むことで、複雑な割り算でも的確に答えに辿り着くことが可能です。

今回のアップデートでは、LLM(システム1の思考)と従来のコード(システム2の思考)の両方の機能を組み合わせることで、Bardの回答の精度を向上させることができました。“implicit code execution”の導入により、Bardは論理的なコードのほうで回答できるプロンプトを特定し、それを“暗黙で”書き、実行し、その結果を使用して、より正確な回答を生成します。これまでのところ、この方法によってGoogleのデータセット内にある計算が必要な単語や数学的な問題に対するBardの回答の精度が約30%向上しています。

一方、このような改良を重ねても、Bardは常に正しいとは限りません。例えば、Bardがユーザーからの質問に適切に回答するためのコードを生成しなかったり、生成したコードが間違っていたり、コードを生成してもそれを回答に使用しなかったりすることもあるかもしれません。しかし、コードの生成によって構造化された論理的な応答ができるようになったことは、Bardをより便利なAIにするための重要な一歩と言えるでしょう。今後にご期待ください。

引用)The Keywordより和訳

AIが得意としていそうな方が後回しだった

今回のGoogleの発表を見ると、なんとなく違和感といいますか…素人考えですが、システム2のような、そういう計算的なやつはそもそも出来ていると勝手に思っていましたね。でも、LLMの方がセンセーショナルで感動的なので、システム1のほうが先だったのですね。

でも、こうして着実に基礎固めしていくあたりがGoogleっぽくて好きです。やはり私の、あと半年から1年くらいでGPTに並ぶのでは?という個人的な予想は当たるかもしれませんね(笑)。まぁ、私のこの予想はシステム1の思考なので根拠ゼロですが(笑)。

カテゴリー

新着記事

人気記事

過去記事