このタイミングであらためてGoogleが「高品質なコンテンツページに向けてなにをしているのか」を説明しています。目新しい情報はございませんが、一応ここでも和訳して共有しておこうかと思います。
Googleの説明内容
検索品質を担保するために、Googleでは(BERTをはじめとした)アルゴリズムの強化と専門組織とのパイプ、検索品質評価者の力を使っていると言っています。もちろんリンクによるシグナルも顕在ですね。そして最後に「手に負えないやつはポリシーに則して刑を執行している」と言っていますね(笑)。
Googleが信頼性の高い情報をどう検索結果に反映させているか
多くの人にとってGoogle検索は、特定の疑問について詳しく知りたい時や、自分の好きなスポーツチームについて友人が話した内容を統計的に検証したい時など、情報を探す際に利用する場所です。Googleでは毎日何十億ものクエリで検索されますが、人々がGoogleを利用し続ける理由の1つとして、関連性が高く信頼できる情報を見つけられるから、が挙げられます。
高品質の検索体験を提供することは、Googleを便利たらしめる核心部分です。PageRankというアルゴリズムを導入した当時からWebコンテンツの質を理解しようと探求し続けてきたことは、他の検索エンジンとGoogleが大きく違う点です。
しかし、皆様から「品質とは何を意味しているのか?Googleが選定する情報が信頼できるとどうやって保証するのか?」という質問をよく耳にします。
簡単にまとめると、情報の品質に対するGoogleの取り組みには3つの大切な要素があります。
- 最初に、人々が有益で信頼できる情報を得るべく、ランキングシステムを根本的に設計する
- それを補完するために、ユーザーがオンライン上で見ているすべての情報の意味を理解するだけでなく、医療機関や政府機関のような権威ある機関からの情報に直接アクセスできるよう、検索機能をいくつか開発している
- 最後に、検索機能に表示されるコンテンツのポリシーを定め、質の高い有益なコンテンツを表示するようにしている
以上3つの取り組みにより、「検索」改善と品質向上をし続け、世界中の人々に信頼される体験を提供しているのです。というわけで、それぞれのアプローチ方法を詳しく見ていきましょう。
品質を重視したランキングシステム
検索心理に最も関連性の高い結果が何か、を理解するため、Googleでは様々な言語理解システムを用意しており、クエリに含まれる単語や概念をGoogleのインデックス内の関連情報と上手く適合しようとしています。これには、スペルミスや同義語などを理解するシステムから、より複雑な自然言語のクエリを理解できるBERTの言語機能のような高度なAIベースのシステムまで様々なものがあります。
Googleの言語理解システムによって検索結果の関連性を高め、検索体験全体を向上させているのです。しかし高品質で信頼できる情報の分別に関しては、Googleの高度な情報理解能力をもってしても、人間のようにコンテンツを理解出来ません。単一の言葉や画像だけでは、何が誇張されているのか、間違っているのか、質が低いのか、役に立たないものなのか、細かく見分けられないことが多いです。
その代わりに、検索エンジンは一般的に「シグナル」と呼ばれるものを通じて、コンテンツの質を大まかに理解しています。これらの「シグナル」は、人間が高品質または信頼できると解釈するページの特徴として、手がかりと考えて良いでしょう。例えば、特定のページにリンクしている質の高いページの数は、そのページが特定のトピックに関して信頼できる情報源であることを示すシグナルであるわけです。
Googleは他にも様々なシグナルを考慮しており、複雑化したシグナルが相性良く機能しているかどうかを理解するために、数多くのテストを実行しています。Googleには世界で10,000人以上の検索品質評価者がいます。この評価者は、何百万ものサンプル検索をまとめて実行し、その結果の品質をE-A-T(専門性、権威性、信頼性)と呼ぶ基準に照らし合わせて評価します。
評価者は、検索品質評価者ガイドラインに記載されている指示に従ってサンプルクエリの結果を評価し、掲載されているページがこれらの品質特性に合致するかどうかを評価します。
直近で、評価プロセスについて詳しく説明しましたが、Googleが受け取る評価者による評価は、ランキングアルゴリズムに直接利用される訳ではありません。一方でこの評価は世界中の人々が情報をどのように評価しているかを検証し、Googleのシステムが高品質コンテンツを適切に提供できているか、総合的に判断するのに役立ちます。そして、この検証データはシステム自体を改善し、質の高い検索結果を正確に提供するために活用されています。
健康、金融、市民情報、危機的状況など、質の高い情報が特に重要なクエリについては、専門性や信頼性に関する要素をさらに重視しています。特定のクエリについて権威性と専門性が高いと判断されているサイトでは、虚偽の情報や誤解を招くような情報を掲載する可能性が低いことが証明されています。これらに関するシステム設計は、潜在的に誤った情報を含む低品質のコンテンツに対する最大の予防策であり、長年にわたって投資してきたGoogleの取り組みなのです。
エキスパートからの情報を、正しい検索結果へ
ほとんどの場合、Googleのランキングシステムは、健康医学等の特定の分野や災害等の危機的な状況下で、Web上から関連性のある信頼性の高い情報を用意に発見できるようになっています。しかし、これらの分野においては、地方自治体、保健機関、選挙管理委員会等の権威ある組織の情報を直接検索で利用できる機能を開発しているのです。
例えば、医療の専門家によって吟味された健康状態や症状に関する情報を掲載したナレッジパネルを検索結果に設置しています。最近では、失業給付に関する情報を検索する人が大幅に増加したため、行政機関と協力して、受給資格の詳細やこの市民サービスへのアクセス方法などを紹介しています。また、長年にわたって、投票方法や投票所の場所を調べるのに役立つ機能も提供してきました。Google市民情報APIを通じて、他のサイトやサービスがこの情報をWeb上で利用できるようにも支援しています。この種の情報は、特に変化の激しい状況下で必ずしも簡単にアルゴリズムだけで見つけられるわけではございませんので、こういった機能を利用することで、人々が最も必要とする時に、最も重要な情報を確実に入手できるようにしています。
目にする情報を理解しやすく
多くの検索では、人々は必ずしもすぐに分かる表面的な内容を求めている訳ではなく、より詳しい情報を理解したいと思っています。また、他からの情報を得た後にGoogle検索することで自分の意見を裏付けしようとする人もいます。
このような場合、ユーザーがオンラインで見ている情報を把握し、信頼できる情報元から、対象の話題の全体像を把握できるような機能体験を提供したいと考えています。
例えば、検索、ニュース、そして今のGoogle画像検索では、ファクトチェックのラベルを表示することで、簡単に事実確認が出来るようにしています。これらのラベルは、ClaimReviewスキーマを使用して公開した事実確認情報をマークアップしているものが対象です。Googleでは数年前からGoogleニュースと検索において情報を一貫網羅する機能が実装されており、ユーザーが様々な角度や視点から入っても、特定のトピックにおける一連の流れを把握できるようにしています。
ポリシーによる検索機能の保護
また、ナレッジパネル、強調スニペット、オートコンプリート機能など、より一般的な検索機能も提供しており、ユニークな方法で情報をハイライトして整理したり、ユーザーが検索したいであろうクエリを予測したりもしています。これらの機能により、検索結果上で特定の情報を強調するため、Googleでは非常に高い品質基準を設けており、どのようなコンテンツがそのスペースに表示されるべきか、細かなガイドラインを設けています。
これらの機能の中ではまず第一に、役に立つコンテンツを表示するよう、自動化されたランキングシステムを設計しています。しかし、Googleのシステムは常に完璧ではありません。そのためGoogleのシステムがポリシーに違反するコンテンツの表示を防ぐことができない場合は、Googleの執行チームがポリシーに基づいて対応します。
Googleの検索機能に対するポリシーへの取り組み方については、こちらの記事をご覧ください。検索についての詳細は、検索の仕組みシリーズの過去の記事をご参照ください。
引用)The Keyword
結論
まぁ、ただの和訳記事になってしまいましたが、ここ最近Google側が発表していた内容をおさらいした形ですね。高品質という定性的な情報をGoogleがいかに、自動化(アルゴリズム改善)、AI化(BERTやRankBrain、ニューラルマッチング等)、人間判断(品質評価者)、パイプライン化(権威機関との提携)、手動化(手動対応等)、シグナル化(リンク等)を駆使して定量化しているかが分かると思います。
ですので、Google検索における「高品質コンテンツとは何ですか?」という質問には「こういうアプローチで良いと判断できるコンテンツのことだよ」と答えると良いでしょう。