前回の記事でも少し触れましたが、Googleが各種ランキングに関わるアルゴリズム的なものを、〇〇アップデートと呼ばずに〇〇システムと呼ぶようになりました(総じて「検索ランキングシステム」という言い方をしています)。そのタイミングでGoogleは各ランキングシステム一覧のページを作成したようで、まだ英文のみの内容ですので、和訳してご紹介したいと思います。
各種ランキングシステム紹介
公開当初には無かった情報ですが、ハミングバードやページスピード、パンダ、ペンギン、HTTPSに関するシステム表記がコアランキングシステムに組み込まれたか別の形で機能しているかで無くなったという情報がございますね。これは意外と重要な情報ですね。以前からSEOに携わっている人からすれば、パンダやペンギンが無くなるって…結構センセーショナルかと思いますが(実際はコアランキングシステムに入り込んだりしているだけですが)。
Google検索ランキングシステムに関するご紹介
Google検索は、インデックスされた何千億ものWebページやその他のコンテンツに関する多くの要因やシグナルを自動ランキングシステムで処理し、最も関連性が高く役立つ結果を瞬時に表示します。
Googleは、厳密なテストと評価を通じて自動ランキングシステムを定期的に改善し、コンテンツ制作の方々に有益と思われる情報が更新された場合には、ランキングシステムのアップデートとしてお知らせしています。
このページでは、Googleの代表的なランキングシステムについて、理解を深めていただくためのご案内をします。ここでは、クエリに応答して検索結果を生成するという基本技術のコアランキングシステムの一部となっている、いくつかのシステムについて取り上げます。また、とりわけランキングに不可欠なシステムについても説明します。
検索の仕組みを紹介しているサイトにアクセスすれば、他のシステムと組み合わせたランキングシステムがどのように連携して機能するかを理解することもできます。こういったGoogle検索の機能によって、世界の情報を整理し、普遍的にアクセス可能で有益な役割となるGoogleの使命を果たしていくのです。
BERT
Bidirectional Encoder Representations from Transformers(BERT)は、Googleが採用しているAIシステムで、言葉の組み合わせによって意味や意図が変わる表現まで理解できるようにするものです。
危機管理情報システム
Googleは、個人的な危機的状況や自然災害、その他広範囲にわたる危機的状況において、管理情報をタイムリーに提供できるシステムを開発しています。
- 個人的な危機とは:Googleのシステムは、自殺、性的暴行、毒物摂取、性暴力、薬物中毒に関する特定のクエリに対して、信頼できる組織のホットラインやコンテンツを表示すべく、検索者が自身の危機的状況に関する情報で何を求めているか理解するように努めています。Google検索で個人の危機に関する情報がどのように表示されるかについて、詳しくはこちらをご覧ください。
- SOSアラート:SOSアラートシステムは、自然災害や広範囲に及ぶ危機的状況において、地域、国、または国際的な当局からの最新情報を表示するために機能します。これらの最新情報には、緊急電話番号やWebサイト、地図、役立つフレーズの翻訳、寄付情報の紹介等が対象となるでしょう。SOSアラートの仕組み、またそれが洪水、山火事、地震、ハリケーンなどの災害時に役立つGoogleの危機管理アラートの一部であることについてもリンク先より詳しくご確認ください。
重複排除システム
Googleで検索すると、何千、何百万もの同じWebページが見つかることがあります。その中には、単純に非常に類似しているだけのものもあるかもしれません。いずれにしても、このような場合はGoogleのシステムは最も関連性の高い結果のみを表示し、有益でない重複ページを回避します。重複排除の仕組みと、発生時の必要に応じて結果を省略表示する方法についてをご参照ください。
重複排除は、強調スニペットにおいても同様です。Webページの検索リストが強調スニペットに採用された場合、その検索リストを検索結果の1ページ目に再表示することはありません。これらは検索結果を整理し、ユーザーが関連情報をより簡単に見つけることができるようにします。
完全一致ドメインシステム
Googleのランキングシステムでは、ドメイン名に含まれる単語について、コンテンツとして検索に関連しているかどうかの評価要因のひとつとして判断します。しかし、完全一致ドメインシステムは、特定のクエリに完全に一致するように設計されたドメインコンテンツだからといって、過度に評価されないように機能しています。たとえば、「best-places-to-eat-lunch」という単語を含むドメイン名を作成し、そのドメイン名に含まれるすべての単語によってコンテンツが上位に表示されることを期待する運用者がいるかもしれませんが、Googleのシステムはこうした事態にも公平に対応します。
フレッシュネスシステム
より最新のコンテンツが求められるクエリに対応できるよう、様々な「検索結果の鮮度」システムを採用しています。例えば、公開されたばかりの映画について検索する場合、制作が始まった頃の古い記事よりも、直近の評価情報が求められるでしょう。例えば、「地震」と検索すると、通常であれば、地震への備えや対策に関する資料がヒットします。しかし、最近地震が起きたのであれば、ニュース記事やより新鮮なコンテンツが表示されるかもしれません。
ヘルプフルコンテンツシステム
Googleのヘルプフルコンテンツシステムは、検索エンジンのトラフィックをただ稼ぐために作られたコンテンツではなく、人が人のために書いたオリジナルのお役立ちコンテンツが検索結果に表示されるよう、より良い機能を搭載しています。
リンク解析システムとページランク
Googleは、ページがそれぞれどのようにリンクしているかを解析し、どのページがクエリに最も役立つかを判断するための様々なシステムを備えています。このうち、ページランクは、Googleが初めてサービスを開始したときに使用された、中核的なランキングシステムのひとつです。詳しくは、ページランクの研究論文と特許資料をご覧ください。ページランクの仕組みはその後も大きく進化しましたが、現在もGoogleの中核的なランキングシステムの一部となっています。
地域情報システム
また、トップニュースやローカルニュース機能など、関連するニュースの地方性を判断し、エリアに合わせて表示するシステムとなっています。
MUM
Multitask Unified Model(MUM)は、言語を理解し生成することができるAIシステムです。現在、検索における一般的なランキングシステムには使用されておらず、コロナワクチン情報における検索結果の改善や、表示される強調スニペットの抽出法改善など、いくつかの特定の用途にのみ使用されています。
ニューラルマッチング
ニューラルマッチングとは、クエリやページに含まれる曖昧な概念をGoogleが理解し、クエリや検索結果を互いにマッチングさせるために使用しているAIシステムです。
オリジナルコンテンツシステム
Googleは、原文となるものも含め、元のコンテンツを単に引用しているページよりも、オリジナルコンテンツを優先表示するためのシステムを持っています。これには、あるページが複数のサイトで重複している場合、サイト所有者が優先表示すべきページをより理解するために使用する特別な正規化記載のサポートも含みます。
削除に基づく順位下落システム
Googleには、特定の種類のコンテンツの削除を受け入れるポリシーがあります。特に特定のサイトに関連する大量削除を行う場合は、その処理をシグナルとして今後の検索結果の改善に役立たせます:
- 法に基づく削除:あるサイトに関連する有効な著作権削除依頼を複数から何件も受け取った場合、それらの依頼を活用して、そのサイトにある他のコンテンツも検索結果で降格させます。こうすることで、著作権を侵害するコンテンツが他にも存在する場合、著作権を侵害するコンテンツが別で表示される機会も減ることになります。また、名誉毀損、模倣品、裁判所命令による削除などについても、同様の降格シグナルを適用しています。
- 個人情報の削除:悪質な排斥行為を行うサイトに対して個人情報の削除依頼を何件も受けた場合、その悪質なサイトに含まれる他のコンテンツも降格させます。また、同じパターンの行動が他のサイトでも発生しているか確認し、発生している場合は、それらのサイトのコンテンツに降格処分を適用します。重複コンテンツの削除依頼を何件も受けたサイトには、同様の降格措置を適用することがあります。さらにGoogleは、名前に関するクエリに対して同意のない露骨な個人画像が、上位表示されるのを防ぐように設計された、自動保護機能も備えています。
ページエクスペリエンスシステム
人は優れたページエクスペリエンスを提供するサイトページを好みます。そのため、Googleは、ページの読み込み速度、モバイルへの対応、煩わしいインタースティシャルがないか、安全な方法で提供されているかなど、様々な基準で評価するページエクスペリエンスシステムを導入しています。また、関連性の高いコンテンツが多数存在する場合、より優れたページエクスペリエンスを持つコンテンツを優先的に表示する仕組みも備えています。
パッセージランキングシステム
パッセージランキングは、Webページの詳細セクションや文節等、ページの一部分単位だけでも評価し、ページと検索の関連性をより良く理解するために使用するAIシステムです。
商品レビューシステム
商品レビューシステムは、テーマをよく知る専門家や愛好家による質の高い商品レビュー、充分な検証方法による分析や実際に使用した結果を提供するコンテンツ等が、より優遇されることを目的としています。
RankBrain
RankBrainは、単語とその概念の関連性を理解するためのAIシステムです。つまり、コンテンツが他の単語や概念レベルで関連していることを理解し、検索に使われた単語が正確に表現されていなくても、より意図を理解した適切な検索結果を返すことができるのです。
信頼できる情報システム
複数のシステムが様々な方法で機能し、可能な限り最も信頼できる情報を表示します。例えば、より権威のあるページを表示したり、質の低いコンテンツを格下げしたり、質の高い一次情報を評価したりします。信頼できる情報が不足している可能性がある場合や、急速に変化するトピックや検索によって得られる情報の品質が低いと判断された検索結果の場合、Googleのシステムはコンテンツアドバイザリーを自動表示します。これらは、より有益な検索結果を導き出すためのヒントも提供します。検索で高品質な情報を提供するためのGoogleアプローチもご覧ください。
サイト多様化システム
Googleのサイト多様化システムでは、通常、検索結果の上位に同じサイトのWebページを2つ以上表示しないようにしており、1つのサイトが上位表示全てを占めてしまうことはありません。ただし、特定の検索に特に関連性があるとシステムが判断した場合は、2つ以上の検索結果リストを表示することがあります。サイト多様化システムでは、通常、サブドメインであっても同じルートドメインの一部として扱います。つまり、サブドメイン(subdomain.example.com)でもルートドメイン(example.com)でも、検索結果上は同じ1つのサイトからのものとして扱われます。ただし、サブドメインが多様性のために適切であると判断された場合は、サブドメインが別のサイトとして扱われることもあります。
スパム検出システム
メールの受信箱がスパムでいっぱいにならないよう、スパムフィルタが非常に役立っていますよね。検索も同様の課題に直面しています。インターネットには膨大な量のスパムが存在し、対処しなければ、最も有益で関連性の高い検索結果を表示することができなくなるからです。Googleは、SpamBrainを含む様々なスパム検出システムを採用し、スパムポリシーに違反するコンテンツや行為に対処しています。これらのシステムは、常に進化しているスパムの脅威に対応すべく、常にアップデートしています。
終了したシステム
以下のシステムは、これまでの歴史をご紹介しておくために記載しておきます。これらのシステムは、後継のシステムに組み込まれたり、Googleのコアランキングシステムの一部に組み込まれたりしています。
ハミングバード
これは2013年8月に実施し、ランキングシステム全体の大幅な改善に繋がりました。今後もランキングシステムとして同じように進化を続けています。
モバイルフレンドリーランキングシステム
モバイルフレンドリーランキングシステムは、クエリに対する検索評価が同じくらいだった場合、モバイルファースト下においてモバイルフレンドリーなコンテンツがより便利であるため、モバイルデバイスでより適切に表示されるサイトページを優先表示していました。このシステムは、その後ページエクスペリエンスシステムに組み込まれました。
ページスピードシステム
2018年にスピードアップデートとして初めて発表されたこのシステムは、クエリに対する検索評価が同じくらいだった場合、モバイルユーザーにとって表示速度が速いほうのサイトページが、Googleのモバイル検索結果でより上位表示されるというものでした。その後、ページエクスペリエンスシステムの一部に組み込まれました。
パンダシステム
これは、高品質でオリジナルなコンテンツが検索結果に確実に表示されるために考案されたシステムです。パンダの愛称が付けられて2011年に発表されたこのシステムはその後も進化し、2015年にはGoogleのコアランキングシステムの一部となりました。
ペンギンシステム
これは、リンクスパム対策を目的としたシステムです。ペンギンの愛称が付けられて2012年に発表されたこのシステムは、2016年にコアランキングシステムに統合されました。
安全なサイトシステム
2014年に発表されたこのシステムは、クエリに対する検索評価が同じくらいだった場合、HTTPSで保護されたサイトの方が上位表示されるものでした。HTTPSの利用がまだ普及していなかった時代に、安全なサイトの成長を後押しすることを目的としていました。その後、Googleのページエクスペリエンスシステムの一部に組み込まれました。
引用)Google Search Centralより和訳
つまり…最新のランキングシステムは記憶に新しく、AIや重要な働きをしている一方で、モバイルフレンドリーもページスピードもHTTPSに関してもページエクスペリエンスシステムの一部になり、パンダとペンギンはコアランキングシステムの一部に、そしてハミングバードは引き続き縁の下で頑張っているという状況のようです(ページエクスペリエンスシステムに関してはこちらでご確認ください。ちなみにその後デスクトップ版のページエクスペリエンスシステムも登場しています)。
大事なのはAIシステムと阻害排除システム
今回Googleが紹介した主要ランキングシステムを見ると、評価をしたり、コンテンツを理解したりするシステムはAI中心に。それとは別に多様化する阻害要素(危険なもの系)を排除するためのシステムはDBによるマイニング中心に形成されている印象を受けます。ある意味体系化されていて、それぞれが有機的且つ整理されて展開していることが分かります。
Google検索が誇るAI四天王。#4枚で言いたいことを言え#提案書 #ブログ初心者とつながりたい #マーケティング #Webマーケティング #SEO #SEOライティング実践講座 #Webライター #webライターと繋がりたい #Webデザイナーと繋がりたい #アフィリエイト #検索 pic.twitter.com/P7PzVZGgaZ
— 清野 剛|CVR向上支援 (@keyouknow) February 15, 2022
あと、とても気になったのはリンク解析システムとページランク。「ページランクは、Googleが初めてサービスを開始したときに使用された、中核的なランキングシステムのひとつです」と書いてあり、また「現在もGoogleの中核的なランキングシステムの一部となっています」とも書いています。Googleが「良質なサイトからリンクされているサイトはやはり良質である」という概念を引き続き持っていることがうかがえますよね。
一方で、SNSの普及や手軽な情報発信の普及により、個人が所有サイトを持ったり、わざわざリンクしたりするケースが減ってきているはずですので、ブランド評価指標やサイテーション評価指標も重要視されてくる時代になるのではないか、とも思います。
今後も様々なランキングシステムが出ては消えていくかもしれませんが、そんな動向をも楽しみたいと思います。