キーワード含有率の無意味さ

いまだに記事コンテンツにおけるキーワード含有率を気にする人がいます。いまだにです。「4%」だの「5%」だのと…。キーワードの使用頻度なんて全くのナンセンスなのですが、ちょうど良い記事がありましたので、ご紹介させていただきながら、その理由を紐解きたいと思います。

追従

ふわふわ

Googleはニューラルマッチングによって意味理解している

私がGoogle検索20周年の際のBen Gomes氏のブログを訳した内容から一部抜粋しますと、以下の通り述べられています。

Google検索が始まった頃は、まだ言語の意味を理解することが出来ませんでしたが、その意味理解能力は向上し続け、今では各AIの進化が下支えとなっています。これは非常に興味深いことで、20年前に私がニューラルネットワーク(※連想と認識によって機械学習を補助する神経回路網)を学校で取り組んだ時は、全く機能させることが出来なかったくらいです。

でも、ニューラルネットワークが単語の理解から始まり、概念の理解まで出来るようになるほど躍進してきたのです。ニューラルエンベディングスという、ニューラルネットワークの中で展開するアプローチ手法によって、言葉というものを、コンセプトの基礎となるニュアンスに転換し、検索の中に含まれる深層心理と表示させるサイトページの中の概念をマッチングさせることを可能にしました。私たちはこの手法をニューラルマッチングと呼んでいます。

引用)The Keyword|Googleより意訳

Web担当者Forumの「グーグルのニューラルマッチング技術は検索の30%に影響!」ではもうちょっと分かりやすく訳してくれているので、そちらの方が分かりやすいかもしれません。

そして今、私たちはニューラルネットワークが「単語の理解」から「概念の理解」を可能にする、大きな飛躍の局面を迎えています。

ニューラルネットワークの分野で開発された neural embedding と呼ばれる手法は、言葉をより曖昧な、根本的な概念へと変換することで、検索クエリの概念と文書の概念を対応づけることができます。私たちはこの手法を「ニューラル マッチング」と呼んでいます。

引用)Web担当者Forum

誤解を恐れずニューラルネットワークを簡単に説明すると「信号の連鎖」です。この信号の連鎖が無数に生じた先に単語があると考えます。逆引きに考えれば、その単語の意味を理解するために無数の連鎖した信号を紐解けば、ニュアンスを理解していけるでしょう。そういった単語がいくつも組み合わさって出来ていくことで、Googleの中で(AIの中で)、コンテンツの意味の定性的定義付けができるはずです。そしてそういった無数のサイトページの中の無数のコンテンツ群の中に検索クエリを投げ込むことで、連鎖した信号を芋づる式に引っ張り上げ、検索結果にランキング表示していく仕組みだと思われます。そのニューラルネットワークには当然(内部も外部も)リンクシグナルも含まれるでしょうし、そのコンテンツの系譜もニューラルネットワークの一部になっているはずです。ちなみに私、個人的にはニューラルマッチングとハミングバードは同じメカニズム形態だと思っていました。

つまり、Googleは文章の意味理解を概念単位で把握し、文脈(コンテキスト)をも読み取れるというわけです。

Web担当者Forumでも取り上げている通り、Danny Sullivan氏によれば検索内の30%はニューラルマッチングによる精度向上を果たしているとのことです。30%といっても、企業サイトが施策するようなYMYL系クエリや商業系クエリは検索ユーザーに直接的に働きかける要素なので、優先的にニューラルマッチング技術が応用されていることは容易に想像できますよね。

ふわふわ

形骸したキーワードは意味ない

ここまで理解できれば、いかに内容のない外形だけのキーワード(単語)が意味を成さないかも分かると思います。施策キーワードを不必要に入れ込んだリンクのアンカーテキストや文章を考えているようでは期待するSEO効果は得られません。

ユーザーが検索に使う「キーワード」、言い換えれば単語にフォーカスしてコンテンツを作るのではダメ。

「検索意図」にフォーカスしたコンテンツ作りが、よりいっそう重要になってくる。

引用)Web担当者Forum

キーワードそのものを考えるではなく、キーワードを入力したユーザー像を想定し、「どんなコンテンツ記事を紹介すれば、喜ばれるだろう。痒いところ(知りたかったところ)に手が届く思いをさせてあげられるだろう。」ということをひたすら考え、コンテンツテキストやコンテンツデザインを施していくことが重要なのです。言葉を変えて言いますと「こんなコンテンツ内容だったら嬉しいだろうなぁ」というコンテンツを作成するのです。

不必要にキーワードを入れ込んだだけの自社サービス紹介コンテンツページはいまだに山ほどありますが、それはユーザーにとっては「サービスを得る際のイチ手段」に過ぎません。つまり検索ユーザーにとっては、「まず欲しい情報」ではないケースが多いはずです。そういったこと(ユーザーが欲しいのは最終的なイチサービスではなく、まずは網羅的な情報であること)をGoogleが理解しているのであれば、そんなイチ手段のサイトページを上位表示するわけがないと思います。少なくともまずは網羅的な情報が欲しいと考えられるようなキーワードでは検索結果2P目以降が良いところでしょう。たとえ上位表示されたとしてもイチ手段に合致した検索クエリの場合にのみだと思います。

こういった見地からも、キーワード含有率を推し量る必要性は無く、コンテンツ内容そのものを広く柔軟に、且つ深く追及していくべきだということです。

とは言っても、Googleが掲げている理論と今の現実アルゴリズムには若干の差異も感じられますが…そこは温かい目で見つつ、おかしいと思えばすぐにフィードバックすることですね(笑)。


関連記事
Googleウェブマスター向け公式ブログでも「しごと検索」に関する構造化データのマークアップ注意点を再喚起していましたが、ちょうど私のほうでも、「しごと検索」枠登場による一般検索へのCTR影響度を検証したデータがございましたので、ご紹介したいと思います。 マークアップのしかたを間違えてはいけない G ...(続きを読む)
ついに来ました。去年の夏頃に実装予定を発表していましたが、Q&Aとライブ動画の構造化データマークアップサポートに続き、今回How-toとFAQに関する構造化データもマークアップ支援するようになったと発表されました。 どんな内容? 「○○ やり方」「○○ 方法」「○○ しかた」等の検索(いわゆるHow ...(続きを読む)
GoogleのWebmaster Central BlogでChromium(Google Chrome開発の元となっているオープンソースのプロジェクト)に合わせてGooglebotが最新のレンダリング機能を持つようになった、と発表されました。つまり、Webページレイアウトをより正確に理解し、ランキ ...(続きを読む)
Google I/O 2019にて、Google検索がAR(拡張現実)を活かした視覚的な機能を発表しました。既にGoogleの「The Keyword」でも取り上げられていますが、これは興味深い内容でしたので、ご紹介したいと思います。 AR検索 これからの機能として紹介されていますが、例えばGoog ...(続きを読む)

コメントを書く

コメントは承認から反映までしばらく時間がかかる場合がございます。メールアドレスが公開されることはございません。