GoogleがThe Keywordで、検索に導入しているAIモデルについて言及しています。AIはただ導入すれば良いだけでなく、弊害も生まれてきます。それは人類に害を及ぼしては決してならず、そのための危機管理をGoogleは徹底しているとのことです。慎重且つ正確にWebサイトを評価できるAIを追求していることについて、具体例と共に紹介してくれていますので、その記事を和訳してご案内します。
Googleのブログ記事内容
AIを導入しても評価の足し算で成功するわけもなく、副作用等を取り除くためにも様々な要因を見つけ出し、マイナーチェンジを繰り返す必要があるようで…そういった内容をMUMの開発状況と共にThe Keywordで説明しています。
責任と共にAIモデルをGoogle検索に適用
20年以上に渡る検索史上、Googleは言語理解の革新における最前線に立ち、世界中の情報をよりアクセスしやすく、誰にとっても便利なものにするというミッションを実現してきました。私たちは情報をより便利なものにしている中で、Web上のクリエイターやパブリッシャー、企業と人々をもっと結びつけるために、こうした技術革新がいかに重要であるかを実感してきました。Googleが誕生して以来、毎年Web上でより多くのトラフィックが生まれているのは、人間の言語理解を目的とした絶え間ない努力の結果です。
また、AIモデルがこのような言語理解の革新を著しく向上させていることも分かっています。ニューラルネットワーク、BERT、MUMと、大きなアルゴリズムの節目を迎えるごとに、情報理解の段階的な変化に驚嘆してきました。しかし、一歩ずつ前進する度に新しい技術によってもたらされるリスクや限界にも注視するようになったのです。
Googleでは、より強力な言語モデルに関わる弊害と課題を検証しており、責任を持って検索にAIを適用することを約束しています。ここでは、そのためのいくつかの方法をご紹介します。
高品質なデータでの事前学習
Googleは、Webコンテンツに内包する不要な偏り要素を減らすために、高品質データで導入前のモデルを事前検証しています。MUMの場合、事前学習に使われるWeb上のデータは、検索品質評価ガイドラインに準拠した検索品質評価基準に基づき、高品質であると判断されたものを使用しています。これにより例えば、誤った情報や露骨で極端なコンテンツを活用してしまうリスクを大幅に軽減することができるため、Google検索のWebアプローチの鍵となっています。
また、すべての人に役立つ検索体験を構築するための取り組みの一環として、MUMは世界中の75以上の言語で事前検証やトレーニングが行なわれました。
厳格な評価
Google検索の改善には、より適切で役立つ検索結果を提供するための厳格な評価プロセスが必要です。検索品質評価者ガイドラインは、優れた検索結果を評価するためにGoogleを導いてくれる北極星のような存在です。人間のほうの評価者はこのガイドラインに従って、Googleによる改善が人々の情報ニーズをより良く満たしているかどうかの理解に役立ちます。
この評価プロセスは、BERTやMUMのような強力な新しいシステムを導入する場合でも、単に新機能を追加する場合においてでも、Google検索の改善を行う中核になっていると言えます。
改善や変更の度合いは毎回異なるため、それに応じてプロセスを調整する必要があります。BERTの場合は、Google検索に導入された時点で英語圏のクエリ10件のうち1件と、非常に大きな割合で影響があったため評価プロセスを通常よりも厳格にしました。システムに問題のあるパターンを持ち込んでいないかどうかを確認するために、品質テストでは大規模且つ高粒度な精査を行いました。
標準的な評価プロセスでは、代表的なクエリの流れで判断している感じですが、改善内容によっては、特定のクエリやトピック領域で変更による品質向上を詳細に検証しています。これにより、問題となるパターンの存在有無を確認し、Google検索への改善を開始する前に軽微な代替策を取ることができます。
検索は完璧ではありませんし、AIを適用しても完璧とは言えません。だからこそ、検索に変更を加える際には広範かつ継続的な評価とテストが必要なのです。
責任あるアプリケーション設計
責任をもって設計・学習されたモデルを使用することに加え、製品やアプリケーションを慎重に設計することは、言語モデルにおける課題対処のキーポイントとなります。Google検索では、これらの重要な対処法の多くはアプリケーションレベル(ひとつのアルゴリズム単位)で発生しますので、エンドユーザーの体験に焦点を当てつつ、小さなAIモデルでも効果的にリスク管理しています。
BERTやMUMなどの新しいAI技術の採用によって個々のシステムを改善し、より効率的且つ効果的にタスクを実行できます。この方法で評価の範囲を絞り、アプリケーション単位で問題や特定のパターンが発生していないか把握しています。問題のある機能が見つかった場合には、より的を絞った解決策の設計ができるようになるでしょう。
占有領域の管理
高度なAIモデルのトレーニングと実行には、大きなエネルギー消費を伴います。アプリケーションに特化した小規模なモデルを学習するもう1つの利点は、MUMのような大規模なモデルのエネルギーコストを、様々なアプリケーションで償却できることです。
Google Researchチームは最近、最先端の言語モデルを学習する際のエネルギーコストに関する研究結果を発表しました。その研究結果によると、効率的なモデル、プロセッサー、データセンターとクリーンなエネルギー源を組み合わせることで、モデルの二酸化炭素排出量を1,000分の1にまで削減できることがわかりました。そして、Googleはこの方法に則して検索モデルを検証しています。
言語モデルの実用化
MUMのような新しい言語モデルは、言語や世界の情報を理解するGoogleの能力を大きく飛躍する可能性を秘めています。しかし、いくら強力だからといって既存のシステムが使えなくなるわけではありません。現在、Google検索には何百ものアルゴリズムや機械学習モデルが採用されていますが、そのいずれも単一的に何か大きなシステムモデルに依存しているわけではありません。
これらの何百ものアルゴリズムの中には、皆様に安全で高品質な体験をしていただくために特別に設計されたシステムや保護機能があります。例えば、Googleのランキングシステムは、関連性と信頼性の高い情報を表示するように設計されています。だから、もし言語モデルが低品質なコンテンツを抱えていたとしても、私たちのシステムはその問題を解消できるように作られているのです。
MUMのような新しい技術を検索に導入することができれば、システムを大幅に改善し、全く新しい製品体験の提供ができます。また、Googleが直面している他の課題への取り組みにも役立つでしょう。AIシステムの向上は、スパム対策の強化だけでなく、既に認知している損失につながる事象やそのパターンに対処するのにも役立ちます。実際、最近ではBERTベースのシステムを導入し、露骨で極端なコンテンツを求めるクエリをより正確に識別できるようになりました。これにより、そういった情報を求めていないユーザーに意図せずショックを与えたり、不快感を与えたりすることを防ぎ、最終的には誰にとっても安全な検索体験を実現することができるでしょう。
私たちはこれらの高度な言語モデルによる情報理解の向上により、Google検索をより良くより役立つサービスにし、これらの新機能を責任を持ってGoogle検索上で提供することを楽しみにしています。
引用)The Keywordより和訳
難しすぎて、良く分かりませんね…(笑)。要は、以下の内容について責任表明している感じです。
- MUMというAI機能はGoogle検索に革新をもたらすだろう
- 新しくAIを導入する時は事前に検証を繰り返している
- 検証は小規模レベルで繰り返しているからリスクも小さなレベルから抽出できる
- 全ては検索品質評価ガイドラインを遵守して開発業務をしている
- 開発に掛る膨大なエネルギーを削減するSDGsも意識している
- このように大規模なAIアルゴリズムの導入でも小規模レベルでも細心の注意を払って行っている
ちなみにMUMとは、以前にもご紹介している通り検索者に合わせて検索結果を多様化するAIシステムです。人によって異なる有益な情報を、検索に合わせて識別して回答する性質を持っています(とざっくり解釈しています)。
コンテンツに求められるのはマーケティング要素
今回の記事を通して、Googleが相当MUMに期待と注力をしていることが分かりますよね。ということは、やはりWebサイト側に求められるのも当然、(以前にも伝えましたが)「誰に伝えたいか」を明確に定義した内容を設計していくことでしょう。ただ「○○とは」と書いているような説明情報ではなく、どんな「状況」にある「誰」をイメージしたコンテンツか、しっかり見定めて――時にはそれも明示した上で、コンテンツを作成していかなければ、ユーザーに有益にはならなくなるかもしれません。
同じようなコンテンツを書いているWebサイトは数多く存在します。どのWebサイトも「自分のコンテンツがマジョリティになる」ことを信じて疑わない情報アプローチです。そんな情報はメジャーメディアやWikipediaに任せれば良いわけで、企業サイトがメディア化目的ではなく検索者にアプローチしたいのであれば、企業サービスのターゲットニーズを見定めて、そこからスタートするコンテンツ設計をしていくことが重要でしょう。広く大きく網掛けしても、結局スルスルッと潜在顧客は離脱していくだけです。
ちゃんとターゲットをフォーカスしてSEOを行っていくことが重要なのです。