Search On 2020の内容

米国現地時間10月15日にGoogleがオンライン開催したSearch On 2020。このフォローアップ記事がThe Keywordに掲載されていますので、和訳しながらご紹介したいと思います。結構長いので、挫けず頑張ります…。

ふわふわ

The Keywordより

ブログ掲載されている内容をまずは和訳します。今回のSearch Onに関しては6記事あるのですが、その中の全体を通して書かれている1記事分だけ和訳します。

AIがいかにGoogleの利便性を上げているか

90年代半ばにコンピュータ・サイエンティストとして初めてWebに触れた時、探している情報を見つけることが困難であること、またそれに反比例して、インターネット上には膨大な量の情報があることに衝撃を受けました。その時に初めて検索というものについて考え始め、それ以来この問題に没入してきました。
この22年間、Google検索を常に良くするべく、Googleはとてつもない進歩を遂げてきました。最近のAIの躍進により、Googleの改善は過去10年間の進歩具合より格段に成長しており、探している情報をより簡単に見つけられるようになっています。本日のSearch Onライブストリームでは、世界に広がる情報を把握し普遍的にアクセス可能なほど利便性を上げるというGoogleの使命を推進すべく、最先端のAI技術をどのようにしてGoogle製品に導入しているかを紹介しました。

探している情報を正確に見つけるために

Google検索の中核をなすのは、検索クエリを理解し、そのクエリに関連する結果をランク付けする能力です。Googleは言語理解の研究に多くの投資をしており、昨年、BERT言語理解システムがGoogle検索でより関連性の高い結果を提供するためにどのように役立っているかを紹介しました。今では、BERTは英語のほぼすべてのクエリで使用されるようになり、質問に対してより質の高い結果を提供できるようになりました。他にも、Googleの最新のAI研究によって可能になった、検索ランキングの新たな進歩についてもご紹介します:

綴り
Googleでは綴りを間違った(スペルミス)単語を理解する能力の向上を続けてきましたが、それには理由がありまして…毎日、10クエリのうち1つはスペルミスが生じているのです。本日、ディープニューラルネットワークを利用した新しいスペル(綴り)アルゴリズムを導入し、スペルミスを解読する能力を大幅に向上させました。実際、今回の変更によって過去5年間の全スペルミス改善よりもかなり大きな改良となりました。

この新しいスペルアルゴリズムは、スペルミスのある単語の文脈を瞬時に理解し、3ミリ秒未満で正確な検索結果を見出すことができます。

文節
せっかく検索の回答になる一文があったとしても、それがWebページの中に深く埋もれてしまっていては、検索したところでその回答を発掘するのは非常に難しくなってしまいます。Googleではこの度、Webページを検索順位に反映する際、ページ全体を通して読み込むのではなく、ページ内の文節単位でも個別に読み込むよう、画期的な進歩を遂げました。ページ全体を通してだけでなく文節単位での合致度も理解出来るようになることで、検索者が求めれば、干し草の中から針を探すような情報であっても発掘することができるようになります。この機能によって、グローバルに全言語で検索クエリの7%に影響することが想定されます。

例

文節まで理解するようになった新しい機能により、同じ検索でも、左側より右側の方が、より関連度の高い答えを出せるようになります。

サブトピック
ユーザーが広義な意味の検索をした際、その検索に関連するサブトピックを理解することで、より多様化した検索結果を提供出来るようになります。例えば「家庭用エクササイズ器具」と検索した場合、低価格商品や高価格商品、小スペースでできるもの等、関連するサブトピックまで理解し、検索結果ページに幅広いコンテンツを表示することができるようになりました。年内にはこの機能を展開していく予定です。

コロナ禍における高品質な情報へのアクセス

検索ユーザーに新しい情報を紹介したり、より安全で効率的に理解を深めてもらうため、Googleはいくつか新しい改善を実行しています。混雑中継アップデートにより、対象の場所の混雑状況をリアルタイムで提示してくれるため、ソーシャルディスタンスにも注意して行動出来るようになりましたし、新たに追加したLive View機能では、店前の状況を確認することが出来るようになりました。新型コロナウイルスに関わる安全情報については、Google検索やGoogleマップからのマイビジネス内に記載できるよう、情報が追加されました。これによって、対象の店舗やサービスが、マスク着用義務の有無があるか、事前予約が必要か、スタッフが体温チェックなどの安全対策を行っているか等を事前に確認することができます。また、店舗の営業時間や在庫状況などのローカルビジネスに関わる内容を、常に最新の情報にすべくDuplexの会話技術を活用しています。

動画の大事な瞬間を理解する

AI技術の新たなアプローチにより、Googleは動画の意味を深く理解し、大事な瞬間を自動識別出来るようになりました。これにより、動画の中で特定の瞬間をタグ付けすることが出来るので、本の各章や目次のように、観たいところまですぐにユーザーを案内可能です。あるレシピの中の1ステップを探している時であろうとも、試合のさよならホームランのハイライト映像を探している時であろうとも、その瞬間を簡単に見つけられるでしょう。このAI技術に関する検証は今年から既に開始しており、2020年末までには、Google検索の10%が新たな技術を使用することになると予想しています。

データを通した深層理解

時には、最適な検索結果がひとつの統計数値ということもあるでしょう。しかし、多くの場合、その統計データは大規模なデータ集計の中に埋もれていて、簡単には抽出できなかったり、オンラインでアクセスできるものではなかったりします。そこで、Googleでは2018年から米国国勢調査局、労働統計局、世界銀行等、その他多くの企業と共同で開始した統計データのオープンナレッジデータベースであるData Commons Projectに取り組んできました。これらのデータセットをまとめることが最初の一歩ではありましたが、今ではGoogle検索から、これらの情報をよりアクセスしやすく、有用なものにしています。
もし「シカゴでは何人の人が働いているのか」というような検索をした場合、自然言語処理を使ってData Commonsにある何十億ものデータポイントの中から特定のデータセットに照準し、適切な統計情報を直感的に提供します。また、他に関連するデータ情報や他の都市の統計情報等も表示するので、より深く掘り下げて理解することができるでしょう。

応用検索によるジャーナリスト支援

影響力のあるジャーナリズムの追求は、長期的な調査やプロジェクトから生まれることが多く、それには膨大な文書や画像、音声記録の収集に工数を割くことになります。Journalist Studioは、ジャーナリストがテクノロジーを活用してより効率的に安全で創造的な仕事が出来るように支援する新しいツールの1つであり、Google検索の力を活用できますが、さらにこの度、Pinpointという新しいツールを提供開始します。Pinpointは、最も頻繁に言及されている人物や組織、場所を自動的に識別して整理することで、何十万もの文書を素早く識別することが出来ます。ジャーナリストはPinpointへのアクセスするために、今週から登録することができます。

見たものを検索して3Dで理解する

多くの場合、百聞は一見に如かずです。Google検索のLensとARにおけるちょっとした新機能により、検索ユーザーが新しい方法で理解したり、買い物をしたり、世界観を発見したりするのに役立つでしょう。今、私たちの多くは自宅で勉強や仕事をする環境に直面していますが、Google Lensを使えば、数学、化学、生物学、物理学等の宿題に対して少しだけ役に立つこともあります。また、ソーシャルディスタンスによって、ショッピング方法も劇的に変わったため、欲しいセーターを探している時や新車をもっと見たいのにショールームに行けない時など、探しているものを視覚的に体験することができます。

探し方が分からない時は歌ってみる

曲が頭から離れないけど歌詞も思い出せない、という経験は誰にでもありますよね。そんな時には鼻歌検索で、AIが適切な曲のメロディーを探し当て、探していた曲を教えてくれます。

その他のGoogle検索のすごいところ

情報を探し出す方法が今まで以上に増えない中、Googleが最も便利で信頼できる検索方法であり続けるために、常に最先端のテクノロジーを開発し続ける必要があります。大きく分けて4つの重要な要素が、Google検索を改善し、毎年何兆もの検索クエリに回答するGoogle検索の全機能の基盤を形成しています。これらの要素があるからこそ、毎日のように使うGoogle検索が便利で信頼できる存在となっているのです。

世界中の情報を理解する
Googleは、Webページ上の言葉、画像や映像、さらには身の回りにある場所や物に含まれる情報まで、世界中のあらゆる情報を深く理解することに努めています。22年前にWebページのインデックスをしたように、AIへの注力で世界のあらゆる情報を分析し、理解することが出来るようになりました。Googleは世界を理解するだけに留まらず、ユーザーが検索しなくても、新しい形の情報や洞察を模索するようになっています。

最高品質の情報
ユーザーは常に最高品質の情報を得るために検索を利用しており、それに対するGoogleの品質への取り組みは、検索サービスを提供し始めた初日からずっと常に他とは一線を画してきたものです。Googleは毎年、検索品質を上げるために何千もの改善を実施しており、そのひとつひとつを丁寧に検証しながらユーザーに役立つ情報を提供しています。Googleのランキング要因とポリシーは、全Webサイトを公平に判断し、多彩な情報や考え、視点に幅広くアクセスできるようになっています。

世界基準のプライバシーとセキュリティ
人々とその情報を安全に保つために、Googleは世界規模のプライバシーとセキュリティに投資しています。セーフブラウジングとスパム対策により、検索ユーザーの安全を守ることで業界を牽引してきました。Googleは、プライバシーこそ普遍的な権利であると信じており、全ユーザーのプライバシー保護に必要なツール提供を心掛けています。

全人類が無料利用
最後になりますが、Googleはすべての人が無料で利用できることを約束します。Googleは誕生以来、開かれたWebの世界を毎年拡大し、その繁栄を支援し続けるようにしています。Googleは誰でも無料でどのデバイスからでもアクセス可能であり、世界の150以上もの言語でサービス展開し、世界中の人々にサービス提供する能力を拡大し続けています。

だから…どこにいても、何を探していても、歌おうとも、打ち込もうとも、話そうとも、見ようとも、それはGoogleで何でも実現することが出来るのです。

引用)The Keywordより和訳

長かったですね(笑)。後半はあまり具体的な話ではありませんでしたが、既にこのブログでご紹介している文節インデックス鼻歌検索の他に、スペルミス、サブトピック、コロナ禍対策、動画理解、集計データの把握、ジャーナリスト向け検索、3D表現について触れられていました。

特にサブトピックに関しては、QDD(Query Deserves Diversity:検索結果の多様化)という働きをアルゴリズムで具現化したような印象を受けますね。

ふわふわ

今後色々変動してくるかも

今後、BERTやニューラルネットワークシステムの強化だけでなく、文節インデックスやサブトピック等、色々なアルゴリズムの変化に伴い、検索順位の変動もありそうですね。11月12月は結構動きそうですので、要注意です。サイト運用者が(ブラックな感じで言うと「対策」という名のもと、)今からすべきことがあるわけではありませんが、とにかく丁寧にWebサイトやコンテンツを作り続けることですね。私も今まさに今後のコンテンツについてUIを見直しているところです。

さぁ、ワクワクしていきましょう♪


関連記事

クロールの統計情報が刷新

Googleは米国現地時間11月24日に、Search Consoleにおけるクロール統計情報のUIと仕様を刷新したことを発表しました。Google Search Central Blogでも記事化されていますので和訳してご紹介します。 To help website owners better u ...(続きを読む)

Google検索セントラルブログへ

Googleは今まで検索に関するブログをWebmaster Central Blog(ウェブマスター向け公式ブログ)という名称で運営していましたが、この度、Webmaster(ウェブマスター)という名称を廃止し、developers.google.com配下で運用するようになりました。 新旧の違い ...(続きを読む)

古いコンテンツの削除ツールが刷新

リンク否認ツールに続き、古いコンテンツの削除ツールがリニューアルしました。GoogleがTwitterで発表しています。インターフェースの変更のようですが、サイトオーナー側で行う作業ではなく、第3者が行うツールですのであまり馴染みがないかと思います。でも何かと便利かもしれませんので、知っておくと良い ...(続きを読む)

リンク否認ツールが刷新

リンク否認ツールがリニューアルしました。GoogleがTwitterで発表しています。マイナーチェンジではありますが、ご紹介します。 Today we're completing the migration of the Disavow links tool to the new Search Co ...(続きを読む)

コメントを書く

コメントは承認から反映までしばらく時間がかかる場合がございます。メールアドレスが公開されることはございません。