Googleの専門家による生成系AI

ChatGPTやBard等に代表される、質問等の入力(プロンプト)に合わせて学習を重ねつつ、言語や画像等を生成して出力するAIのことをジェネレーティブ(生成系)AIと呼びます。このジェネレーティブ(生成系)AIについて、Googleが自社の技術系専門家(Douglas Eck氏)にインタビューした内容をQ&A形式でThe Keywordに掲載していましたので、和訳してご紹介したいと思います。

Googleが考えること

Googleの中の人がGoogleの中の専門家に聞いた話なので、なんとなくポジショントーク的な要素もあるかな、と思っていたのですが、専門家のEck氏のパーソナルな考えな感じがして、読み心地が良かったです。このインタビューを通してGoogleのスタンスを知ってほしい、というメッセージが隠されているとは思いますので、一読されることをおすすめします。

テックスペシャリストに聞く:ジェネレーティブAIって何?

GoogleのAI専門家が解説します。
私たちは最近、ジェネレーティブAIとコラボした初期段階の実験であるBardへの利用を拡大しました。Bardは大規模な言語モデルを搭載しており、これは機械学習モデルの一種で、自然な響きの言語を生成する能力ということでご認識いただいているものです。そのため「生成型AI」という表現もよく耳にされるようになったと思います。同時に、「ジェネレーティブAIとは何なのか」という…新しい技術であればあるほど、その技術について疑問が湧いてくるものです。
そこで、ジェネレーティブAI、大規模言語モデル、機械学習などに関する一般的な質問について、GoogleのシニアリサーチディレクターであるDouglas Eck氏に話を聞きました。DouglasはAI分野の最前線で活躍しているだけでなく、文学や音楽研究のバックグラウンドも持っています。技術的な側面とクリエイティブな側面を併せ持つ彼は、ジェネレーティブAIの仕組みと、それがテクノロジーとクリエイティビティの未来にもたらす意味を説明できる特別な立場にあります。以下は、彼のコメントです。
 

ジェネレーティブAIの話をする前に、より広い意味でのAIについて話しておく必要があると思います。AIは興味深い言葉ですが、しばしば漠然とした言葉です。AIとは一体何なのでしょうか?

AIは、あらゆる種類の高度なコンピュータシステムを表現するためによく使われる広い意味の言葉です。ですので、私はもっと具体的に「機械学習」と捉えて話すほうが好みです。今日、私たちが目にするAIのほとんどはまさに機械学習であり、コンピュータシステムに対して事例から学習する能力を与える機能を意味しています。
事例から学ぶようにプログラムされた機械を、私たちは“ニューラルネットワーク”と呼んでいます。ニューラルネットワークが学習する主な方法のひとつは、誰かに画像に写っているものを教えてもらうように、たくさんの事例を与えられて学習する方法です(これを分類と呼びます)。例えば、ニューラルネットワークに象の見分け方を教えようと思ったら、人間が象の見分け方をたくさん紹介し、その写真にタグ付けをしていきます。そうすることで、象と画像内の他の対象物を区別できるようになります。
言語モデルもそういうニューラルネットワークの一種です。
 

言語モデルはどのように機能するのでしょうか?

基本的に言語モデルは、一連の文章の中で次に来る単語を予測します。大量のテキストでこのモデルを訓練することで、次に来るであろう単語をより理解できるようになります。言語モデルを改良する方法のひとつは、より多くの“閲読”を与えること、つまりより多くのデータで学習させることです。例えば、「Mary kicked a…」というフレーズを入力し始めたら、充分なデータ訓練された言語モデルなら「Mary kicked a ball」と予測できるでしょう。しかし、充分な訓練を受けていない言語モデルの場合、後に続く単語は「丸い物体」や「黄色」という程度の内容までしか思いつかないかもしれません。言語モデルの訓練に必要なデータが多ければ多いほど、言語モデルのニュアンスが増し、メアリーが蹴った可能性が高いものを正確に知ることができるようになるのです。
ここ数年、言語モデルのサイズを拡大したり、特定の処理領域に必要なデータ量を減らすなど、言語モデルの性能を向上させる方法について大きな進歩が起きています。例えば、Gmailのスマート作成機能やスマートリプライ機能など、言語モデルは既に皆さまの役に立っています。そして、言語モデルはBardにも力を与えています。
 

なるほど。さて、ここまでAIと言語モデルについて説明していただきました。では、ジェネレーティブAIはどうでしょうか?

生成モデルは、表示された事例から学んだことを踏まえて、その情報に基づいて全く新しいものを作り出すことができます。だから「生成(ジェネレーティブ)」という言葉を使っているのです。大規模言語モデル(LLM)は、自然な響きの言語の形でテキストの新しい組み合わせを生成するため、ジェネレーティブAIの一種です。さらに、ImagenAudioLMPhenakiのように、新しい画像、音声、動画など、他の種類のアウトプットを生成する言語モデルも構築できます。
 

これにより、皆さまが懸念する大きな疑問が生じると思いますが:ジェネレーティブAIは、クリエイティブ領域やクリエイティビティ全般にとって、どのような意味を持つのでしょうか?

私は、クリエイティブな分野には大きな可能性があると思います。ジェネレーティブAIは、原稿を生成するようなありふれた反復的な雑務の一部を除いて、もともと人間が持つクリエイティビティを邪魔するようなものではありません。音楽のイチ研究者として、私はジェネレーティブAIを数十年前のドラムマシンの登場と同じように考えています。ドラムマシンが人間のドラマーとは異なるリズムを生み出すことで、人間がまったく新しいジャンルの音楽を生み出す原動力となりました。
 

1980年代の多くの音楽がそうですね。

確かに、ヒップホップがブロンクスでドラムマシンを使って進化したのもそうです。あのジャンル全体が、音楽におけるこの新しいバックエンド技術の開発によって進歩したのです。ドラムマシンはドラマーに取って代わられたのではなく、音楽領域に新しい層(レイヤー)が加えられただけなのです。
 

明らかに、ジェネレーティブAIにはチャンスがあります。しかし、ジェネレーティブAIが抱える潜在的な課題についてはどうでしょうか?

私は2人の子供を育て、コンピュータサイエンスに進む前には文学の学位を取得しました。ですので、ジェネレーティブAIが中学2年生や3年生が書くほどの作文を作れるこの世界において、教育者の立場でどのように子どもの成長や育成を測るのか、いつも考えています。
思えば、グラフ電卓が登場したとき、教師は生徒が自分の力で計算できたかどうかをどうやって知ることができたのでしょうか。生徒は自由に使える道具があることを理解しながらも、今までにない方法で自分たちの“能力を示す”ことを要求されることとなり、そういう形で教育は進歩したのです。
私たちを含め、企業には、これらのモデルが何に適しているのか、そして、これが崩壊ではなく進化であることをどう認識していくか、考え抜く責任があります。
 

責任について言及されたのはうれしいですね。Googleが機械学習の開発にどのように取り組んでいるか、お聞かせください。

私たちは、時間をかけてじっくりと取り組んでいます。何かの商品を作るなら、それがどう役に立ち、害にはならないか、確信して進めたいのです。2018年、私たちはAI原理を開発・公表した最初の企業のひとつであり、それに伴い内部ガバナンス構造を調整しました。今日の私たちのAI業務には、GoogleのResponsible AIグループや、新興技術の開発中に偏見や致命的な害、その他の危険を回避することに焦点を当てた他多くのグループも参加しています。
 

こうした大きな技術的飛躍は、すでに小さな役に立つ形で現れているという話を聞いたことがあります。しかし、ジェネレーティブAIは社会にとってどれほどの飛躍となり得るのでしょうか?

現在、画像の分類や文書の生成といった単純な問題を機械が解決できることは理解しています。しかし私は、複雑な推論を伴う問題を解決するような、さらに野心的な能力を発揮する準備はできていると考えています。今日時点でジェネレーティブAIは、皆さまがテンプレート形式の手紙を書くのを助けるかもしれません。しかし明日には、クリエイティブなワークフローやプロセスを見直し、まったく新しい課題を新しい発想で解決できるようになるかもしれません。今後私たちは、コラボレーションと実験を通じて、ジェネレーティブAIがもたらす更なる恩恵を発見していくこととなるでしょう。

引用)The Keyword

 

とても分かりやすい内容でした。AIの学習の仕組み(膨大なビッグデータ処理)とそこから派生したジェネレーティブAI、さらにジェネレーティブAIが人間の創造性や業務に取って代わるのではなく、人間の創造性や業務をワンランク上にあげてくれること、それを歴史が証明していること、さらには倫理観を持って取り組んでいること。そういったことを端的に答えてくれた感じがしますね。

ジェネレーティブAIがどうなろうが…

まだまだジェネレーティブAIに保守的であったり批判的な人(「人間が職を失う」とか「ターミネーターの世界(古いw)だ」とか)もいるでしょうし、肯定的な人(「これからの仕事のレベルが上がる」とか「感情に左右されず、公平的且つ便利で良い世の中になる」とか)もいるかと思います。

私個人の意見としては、「自分が否定しようが肯定しようが、AI開発は進歩するもの」なので止められないと思っています。であれば「取って代わられる」と不安になるよりも「じゃあ、どうやってAIを使っていこうか」と考えたほうが楽しいのかな、と。良くも悪くも好奇心のほうが上回っている気持ちです。すでにプロンプトエンジニアという“AI使い”なる職域も生まれていますし、今までにない領域も出てきそうで、楽しみです。というか、ビジネスチャンスをずっと窺っている感じです(笑)。

まぁGoogleに対して好意的な私としては、早くGoogleのジェネレーティブAIやBardが良くなることを願っています。

カテゴリー

新着記事

人気記事

過去記事