ナレッジパネルとナレッジグラフについて、Googleは5,000億以上の事実要素から50億ものエンティティを作成してきました。そして、このタイミングで改めてThe Keywordでナレッジパネルとナレッジグラフの説明をしてくれているので、ご紹介します。
Google’s Knowledge Graph has amassed over 500 billion facts about five billion entities — people, places and things. This post explains how the Knowledge Graph works, presents information in knowledge panels & how we work to improve it. https://blog.google/products/search/about-knowledge-graph-and-knowledge-panels/
— Google SearchLiaison(@searchliaison) 2020年5月21日
https://blog.google/products/search/about-knowledge-graph-and-knowledge-panels/
引用)@searchliaisonより和訳
Googleからの説明内容
GoogleがThe Keywordで記事化してくれているのは以下の内容です。
ナレッジパネルとは?
ナレッジパネルとはデスクトップ上で検索結果画面の右側に表示され、容易に検索ユーザーの目に飛び込んでくるものです:
ナレッジパネルはその対象トピックについてもっとも関連性があり、有名な情報を表示するようシステムに組み込まれています。ナレッジパネルに登場する対象として全く同じトピックがないのと同様、ナレッジパネルに表示される内容は1つ1つ異なります。とはいえ、原則は以下の内容を含みます:
- トピックのタイトルと短い要約文
- トピックの長い説明文
- 人や場所、物についての写真や画像
- 著名人の生年月日や、特定物の所在地等の重要な情報
- ソーシャルプロフィールや公式サイトへのリンク
また、ナレッジパネルは特定の話題については特殊な情報を含むこともあります。例えば以下が挙げられます:
- 歌手の場合はその楽曲
- テレビ番組の場合は次回放送エピソード
- スポーツチームの場合はそのチーム員名簿
ナレッジグラフの情報元
ナレッジパネルとなる人や場所、物のことを「エンティティ」と呼び、これは2012年に開始されたナレッジグラフがデータ元となっています。ナレッジグラフとはウェブ上で共有されている素材からエンティティについての情報や事実要素を理解し、またオープンソースや提携しているデータベースを理解するためのシステムを指します。これまで50億ものエンティティについて、5,000億以上の事実要素を蓄積してきました。
Wikipediaは一般的に引用されているソースではありますが、何もWikipediaだけをソース元としているわけではありません。Googleでは音楽、スポーツ、テレビに関して、ライセンス許可されたデータと共に、Web上の何百もの情報をソース元として活用し、ナレッジパネルに表示しています。また、医療機関提供者と協業し、健康問題に関するナレッジパネルは慎重に吟味を重ねた上でコンテンツ生成しています。コンテンツオーナーが利用できる特殊なコーディング、例えば、今後予定されているイベント通知などの機能も活用しています。
モバイルでは複数のナレッジパネルを提供
ナレッジパネルを開始した当初は、ほとんどがデスクトップでの検索だったこともあり、検索結果のすぐ横にナレッジパネルを表示させるための場所としても充分余裕がありました。しかし昨今では、ほとんどの検索がモバイルで行われており、横に並べて表示させる程充分な広さがあるわけではありません。
そのためモバイルの場合では、1つのナレッジパネルだけで表示されないことが多いです。代わりに、1つ以上の複数のナレッジパネルが全体の検索結果に分散表示されます。
ナレッジグラフ改善のための取り組み
ナレッジグラフに不正確な情報が含まれてしまうこともたまに起こります。ナレッジグラフには、自動的に情報収集するシステムがあるように、不正情報を自動的に駆逐するシステムもあります。しかし、何事もそうですが、システムは完璧ではありません。だからこそ、問題が発生した場合の皆様からのフィードバックを受け付けています。
ナレッジパネルの下部にある「フィードバック」リンクを選択するか、モバイルの上部に出てくる3つの点を選択するとフィードバックのオプションが表示されます:
このようにフィードバックを分析し、実際にどのような不正情報がシステムをすり抜けてしまったのかを検証することで、ナレッジグラフ全体の改善に繋げています。また、ポリシーに違反している不正情報も同様に削除しており、特に公益、医療、科学、歴史などの公益性の高いトピックについては危険性が高いため、迅速かつ優先的に取り締まっています。
ナレッジパネルの変更を依頼・提案する方法
多くのナレッジパネルでは個人や企業などからトピックについて変更などの「要請」を行なうことが出来ます。要請プロセスは(Googleでは認証を受けると呼びますが)、話題に対して修正すべき内容について直接Googleにフィードバック申請したり、より最適な画像を提案したりすることが可能です。ローカルビジネスの場合は、Googleマイビジネスを通して要請する別の方法があります。これにより営業時間や電話番号など、ナレッジパネルで特定の要素を管理することが出来ます。
この件についての詳細は、検索の仕組みについてのブログシリーズやWebサイトをご参照ください。
引用)The keywordより和訳
膨大な情報量
要は「ナレッジグラフというシステムがあって、そこには提携データベースやWebサイトのクローリング等により正確な情報が集められています。そのナレッジグラフを元にナレッジパネルが成り立っているのですが、たまにどうしてもシステムを掻い潜った不正情報が表示されてしまうこともあるので、見かけたらフィードバックしてね」ということです。
世界で約50億のナレッジパネルが存在しているんですね。
企業情報等、ビジネスにおける誤記があればGoogleマイビジネスから申請できますが、公共要素や(本人が気にしていない)著名人情報等に関しては積極的にフィードバックすると良いでしょう。昔はよくテレビでも芸人さんが「Wikipediaの情報が全然違う」と笑い話にしていましたが、もう何年かすればこんな笑い話も当てはまらないくらい正確になっていくのでしょう。同じように、ナレッジパネルの写真が別人だったことも以前はよくありましたが、もうそういうこともなくなっていくのでしょうね。
時代とGoogleの進化は速いものです(感)。