MUM凄いぞって話

先日開催されたGoogle I/Oを通して話題になりましたMUMにつきまして、ほぼリアルタイムにThe Keywordでも記事になっていましたので和訳してご紹介しつつ、私の意見も記載していこうかと思います。

MUM

ふわふわ

MUMって?

MUMとは「Multitask Unified Model」の略で、直訳的に考えると複合要素統一型AIって感じです。複数の要素を一本化してより完全的な回答をする機能かと思われます。まだ顕在化した実例も出てませんし、明確な導入は数年先になるかもしれませんので今の段階でははっきりと言えていませんが、Googleは例を挙げながら説明してくれています。まずはThe Keywordの記事を和訳してご紹介します。

MUM:情報を理解するための新たなAI過程

Google検索に関わる仕事をしていると言うと、周りからは「まだやらなきゃいけないことがあるの?」と聞かれることがあります。回答としては「もちろん!」と語気を荒げます。検索が皆様により良いものになるよう、Googleが解決すべき課題は数え切れないほどあります。そこで今回は、多くの人が経験したことのある「欲しかった答えを得るために、何度もクエリを入力し検索を繰り返さなければならない」という問題にどう取り組んでいるかをご紹介します。

例えば、こんなケースを想像してみてください:あなたはアダムス山をハイキングしたことがあります。今、あなたは来秋に富士山への登山を決心し、そのために必要なことを知りたいと思っています。現在、Googleはこのような考えを手助けしてはくれますが、そのためには、それぞれの山の標高、秋の平均気温、ハイキングコースの難易度、最適な道具など、熟考を重ねながら検索を繰り返す必要があります。とはいえ何度も検索しているうち、最終的には自分が必要としている回答を得られるでしょう。
一方で、もしあなたがハイキングの専門家と話をしていたら、「富士登山の準備のためにこれまでと何か違うことはありますか?」という1つの質問で解決できるでしょう。あなたの現状から課題のニュアンスを理解した上で、考慮すべき多くのことを教えてくれる丁寧な回答が得られるでしょう。
この例は決して特別なものではありません。私たちの多くは、複数のステップを必要とする色々な検索行動内で、毎日のようにGoogleでこのような場面に遭遇しています。実際、今回のような複雑な検索行動では、平均して8つまでのクエリを使って検索されていることが判明しています。
今の検索エンジンは、専門家のような洗練された回答をするのに充分な機能を備えていません。しかし、Multitask Unified Model(MUM)と呼ばれる新しい技術により、このような複雑なニーズにも対応できるようになりつつあります。将来的には、より少ない検索回数で欲しい情報を手に入れることができるでしょう。

シンプルな答えが見つからないときのサポート

MUMは、複雑な行動様式に対するGoogle支援方法をも変える可能性を秘めています。BERT同様、MUMも変換性構造をベースに構築されていますが、その性能はBERTの1,000倍以上です。MUMは言語理解だけでなく、言語生成も可能です。MUMは、75に及ぶ多言語と多くの異なる検索行動を同時に学習できるよう訓練されており、従来のモデルよりも情報量と世界的知識をより包括的に理解することができます。またMUMは多様式機能で、テキストや画像情報だけでなく、将来的には動画や音声情報など、より多くの行動様式に合わせて情報を理解することができます。

先ほどの富士山への登山に関する質問を例に取り上げてみましょう:MUMは2つの山を比較しているので、まず標高や登山道の情報が関係してくることを理解します。また、山登りの場合の「準備」には、体力トレーニングや適切な道具を探すことなども含まれることを理解します。
MUMは、世界中にある幅広い知識に基づいて知見を得るため、「2つはほぼ同じ標高の山ではあるけど、秋の富士山は雨季になるので、防水性のあるジャケットが必要かもしれない」ということを強調して回答するようになるでしょう。また、より掘り下げて準備するための補足事項として、一流の道具周りや最適なトレーニング方法など、Web上の役立つ記事や動画、画像を使って案内することもできます。

言語の壁を取り除く

言語は、情報にアクセスする際に大きな障壁となり得ます。しかし、MUMの機能によって言語を超えた知識を伝達するため、この障壁を無くす可能性を秘めています。MUMは、検索した言語では見つからない情報源をも学習することで、他言語の適切な情報を届けることだってできるのです。
例えば、日本語で書かれた富士山の情報があったとします。今の時点では日本語で検索しなければその情報を見つけることはできません。しかし、MUMは言語を超えた情報源から知識を転換し、その知識を活かして検索者が使う言語で最も関連性の高い結果を出すことができます。将来的には、富士山に関する情報を検索すると、日本語で検索した際に得られる多くの情報、例えば、富士山の絶景を楽しめる場所や温泉、人気の土産屋なども自国(この場合、米国等)の検索結果として得られるようになるかもしれません。

種類を超えた情報の理解

MUMは多様式機能なので、Webページや写真など、様々な形式の情報を同時に理解することができます。近いうちに、登山靴の写真を撮って「これで富士山に登れますか?」と質問できるようになるかもしれません。MUMはその画像を理解し、質問の内容と結びつけて、そのブーツが問題なく使えることを知らせてくれるでしょう。さらには、おすすめのギアを紹介しているブログまで教えてくれるかもしれません。

責任をもって高度なAIを検索活用する

世界中の情報にアクセスできるAIを飛躍的に進化させる際は、必ず責任を伴います。Google検索に改良を加える度、より適切で役立つ検索結果を提供すべく厳しい評価プロセスを経ています。検索品質評価者ガイドラインに沿った人間による評価は、検索結果が人々の情報検索にどれだけ有益かを理解するのに役立ちます。
2019年に発表されたBERTの多くのアプリケーションを慎重にテストしたように、MUMも同じプロセスを経て検索に適用します。具体的には、機械学習の偏りを示す可能性のあるパターンを探し、Googleのシステムに偏りがないようにします。また、MUMのような訓練システムによる二酸化炭素排出量を削減する方法に関して、最新の研究から得られた知見を適用し、検索が可能な限り少ないエネルギーで効率的に稼働し続けるようにします。
今後、数ヶ月から数年の間に、MUMを使った機能や改良をGoogle製品に反映させていく予定です。MUMの研究はまだ始まったばかりですが、人々が自然に情報を伝えたり解釈したりする方法をGoogleが理解できる未来に向けて、重要な過程となるのです。

引用)The Keywordより和訳

まとめてみましょう。MUMは「(どんな段階にいる)誰が」「何を」「どうやって」知りたいのかを理解し、様々な方法で世界中の知識を縫合して回答してくれる機能です。

  • 通常8回くらい検索しないと到達できないような複雑な検索心理に対して、最低限の検索で適切な回答が出来る。
  • それは情報のツギハギではなく、縫合して言語生成する。
  • テキストや画像だけではなく動画や音声にも対応できるようになる。
  • 世界中の情報を処理するため、自分の国だけでは得られない(存在しない)情報でも置換して常用言語に合わせて回答してくれる。
  • MUMはより少ないエネルギーで稼働する。

凄くないですか!? 本当にAIロボットみたいな機能です。
まず、最低限の検索で適切な回答をするためにWebサイト単位でクロールして…という概念が崩壊することでしょう。つまり、世界中のWebサイトを通してコンテンツで理解・判別するわけです。そして、それはアウトプットとしても活かされるわけで、ただの検索結果だけではなく、GoogleアシスタントやGoogleレンズ、Google画像等、あらゆるサービス見地で利用されます。あらゆるサービスで利用できるなら、それを統合して、Googleの目や耳、口が一体化されるようになるわけです。しかも世界的な知識のインプットとアウトプットです。
それが少量のエネルギーで稼働できるって…。

ふわふわ

Webサイト側はどうする?

単純にこれを受けてSEO云々とかいう次元ではないですね。むしろ直訳して言うならば、Googleによる「検索エンジン最適化」の話って感じです。

ただ、従来より私は言い続けていたのですが、「いずれWebサイトという概念は崩壊して、コンテンツという概念がクラウドのように存在する、それをどう選択するかはユーザー次第になる」と思っていました。そして「検索クエリは点在するニーズに過ぎない。Webサイト側がサービスを提供したいなら、常時ターゲティングしたコンテンツを展開すべきだ」と言っています。ニーズとターゲットを混同して捉えるサイト運用者が多いから、CVRに悩むわけだと。
インターネットの普及と玉石混交なWebサイトの大量産出によって、Webサイト側が無作為に「皆に伝える」という概念は終わったのかもしれません。情報飽和時代においては、「誰に伝えたいか」が重要になってくることでしょう。今後、Webサイトはますますマーケティング活動に真剣に取り組むことが重要になってくるかと思います。
この意見を聞いてくれる背景ときっかけにSEOやMUMがあるのかもしれませんが、SEOやMUMがあろうがなかろうがそもそもやらなきゃいけないことなんですよね。

というわけで、ますますSEOは死語となり、ただただ「サイトを良くする」ことが求められるようになっていくことでしょう。


関連記事

Search Console Insightsがリリース

2020年8月にSearch Console Insightsのベータ版がリリースされていました。私はベータ版の対象者になっていたので、当時は詳細を紹介していました。これが米国現地時間2021年6月15日に正式にリリース紹介されましたので、あらためてご紹介します。ここ数日間をかけて徐々にロールアウト ...(続きを読む)

SEOが不要になる

私の個人的な意見です。個人的な意見というのは、確証が無い憶測での記事ということですので、ゆる~い感じでご覧いただければと思います。 SEOとはSearch Engine Optimizationの略で「検索エンジン最適化」の訳ですが、このSEOについて、何か特別なマークアップ以外はもう考えなくて良く ...(続きを読む)

GSCのクエリフィルタリング機能更新

先日、Google Search Console内での検索パフォーマンスで正規表現フィルタが新機能として実装されたことをご紹介しましたが、その後この機能がアップデートされたと米国現地時間6月1日にGoogleは発表しました。発表内容は日本語ですが、ここでもご紹介します。 Googleからの発表内容 ...(続きを読む)

202106コアアップデート

Googleは米国現地時間6月2日にコアアップデートを行うことをツイートしました。前回が米国現地時間2020年12月3日でしたので、約半年後の告知となっています。コアアップデートの度にGoogleは2019年8月のブログ記事を引用して発表していますが、その記事の和訳は私のブログでこちらに記載していま ...(続きを読む)

コメントを書く

コメントは承認から反映までしばらく時間がかかる場合がございます。メールアドレスが公開されることはございません。