思わぬインデックスについて

サイトが出来上がって間もないわけでもないのに「検索順位が上がりにくい」「競合が弱いのに簡単なキーワードでも順位向上しない」等という疑問も多くいただきますので、インデックスステータスについてご紹介します。これからご紹介する内容は意外と気付いていなかった発見もあったりしますので有用だと思います。

気持ちも晴れる

検索順位が上がらない理由の模索

検索順位が上がらない理由は実に様々な要因が考えられますが、あらゆるテクニックやコンテンツ、外部リンク等、しっかり期待できるようになっているものの、結果として順位がついてこない場合は以下のことも考えられます。

キーワードのカニバリゼーション

同じドメイン内の2つ以上のページ同士がキーワードを食い合っちゃってるパターンです。同じようなコンテンツパワーの場合、内部リンク状況やページ間の上下関係がしっかりできていないと陥るケースが多いです。この場合、どちらのページの方を上位表示して良いかGoogleが判断できず、結果としてどちらも検索順位が上がりにくくなります。これは主にtitleタグやコンテンツ、内部リンク状況や階層構造等で回避できますが、そもそもの情報設計の段階でページの優劣をつけられなかったことが原因です。

類似コンテンツ

手動対応(いわゆるペナルティ)を受けるような重複コンテンツではなく、なんとなくのんべんだらりと同じような内容のコンテンツが羅列されてばかりいるサイトは検索順位が上がりにくいです。一定のテーマに関するブログ形式的な情報紹介にありがちなパターンです。重複コンテンツというとちょっと強めの言い方になりますので、類似コンテンツという言い方をしていますが、サイト運営者に訊くと「このキーワードでこのページを上げたいんだ」とか言われるのですが、客観的にサイトを見ると結局そのキーワードだとどのページが検索順位で上昇するのか見分けがつかないものだったりします。これもそもそもの情報設計の段階でページのコンテンツ配分を考えていなかったことが原因です。

余計なページの増加

サイト運営者も気付かないような形で、意図せずURLを生み出しているケースもあります。WordPress等のCMSを使っていると/category/や?=admin等が追加された余計なURLが出来てしまったり、セッション確認のためのパラメータやサイト内検索結果によるパラメータがURLとしてGoogleに認識されてしまっていたり…この辺の例に関しては枚挙に暇がありません。しかもドアウェイページに抵触するようなコンテンツ自動生成によって大量にURLが増加しているサイトもいまだにあったりします。

ふわふわ

課題発見のための方法

何度も言うようにこういったケースは気付かないからこそ厄介だったりします。そこでもし冒頭に申し上げた状況であったら、騙されたと思って一度以下のやり方でインデックスステータスを確認することをオススメします。

siteコマンドを使って何ページも見る

手が空いている時にやっておきたいこと」でご紹介しました”site:”を使った検索です。自分が運営しているサイトのドメインを調べる方法です。実際にこのブログを例に挙げてご紹介します。

siteコマンドの検索結果

まずは上記のように検索した結果の結果件数を確認します。この場合は約78件と出ています。まずはこの数字が実際に把握しているファイル数(ページ数)と近似値になっているか確認してください。私の場合は、ファイル数だけでなくカテゴリページも含めるとかなり実際の数字に近いので問題ないという判断になります。
でも、実はこの数字には落とし穴があって、検索結果のページを確認して進んでいくと実際とは異なっていたりするので注意が必要です。

検索結果のページ送り

上記のようにどんどんページを進んでいくと…

検索結果最後のページ

ご覧のように先ほどは78件だったのが、71件に変わっています。まぁ、私のブログのページ数としては確かにそんなもんでしょう。
しかし、「最も的確な検索結果を表示するために、上の71件と似たページは除外されています。検索結果をすべて表示するには、ここから再検索してください。」という表記が出てきました。これは要は「類似したページはここで紹介していませんよ。ややこしいから。」と言っているわけです。変なページは見せていないということです。
そこで、「ここから再検索してください」というところをクリックすると、先ほどの類似したページも含めて再度紹介してくれます。

再び検索結果

1件増えました。そして予期していない変なページ(phpファイル)が読み込まれていまっていることに気づきました(笑)。こんな調子でsiteコマンドを使うことで発見できたりするわけです。
ちなみにsiteコマンドを使う際は、www.が有るバージョンと無いバージョンのドメインで行うことをオススメします。正規ドメインとして活用しているのがwww.有のはずなのに、www.無のドメインがインデックスされていたりするとそれも厄介になりますので、しっかりリダイレクト設定することにも気づかされます。

XMLサイトマップを確認する

これは簡単ですね。XMLのサイトマップに表記しているURLページ数が実際のページ数と同じか確認してください。よくあるケースとしてはXMLサイトマップの自動生成ツールを使うことで、余計なパラメータ付のURLも排出してしまって、そのままインデックスされてしまうことです。WebMasterToolに読み込まれているXMLサイトマップの送信URL数も確認しておくと良いでしょう。

WebMasterToolでインデックスステータスを確認

これはGoogleが読み込んでいるページ数を表しています。先ほどのsiteコマンドの時と同様の数値が出てくると思いますが、インデックスされた時期も分かりますので「何も行っていない時期に急激にインデックス数が増えている」等があったら要注意です。意図していないURLが読み込まれたりしているかもしれません。

ふわふわ

まとめ

以上になりますが、これらを行うと、どこかにズレが生じることがあります。何かしらの数値に大きな乖離があったら要注意です。重複コンテンツによる手動対応(ペナルティ)やソフト404ページを返されていることによるクロールエラーであればWebMasterToolで分かりますが、それ以外でも今回のやり方を活用してご確認ください。私のように余計な1ページがインデックスされていたりしますので…(笑)。