XMLサイトマップにおける最低限の検証と設定についてご紹介しておきます。Webサイトを新しく立ち上げる際、意外と訊かれることが多いので、私もこのページをすぐ案内できるように備忘録的に書き記しておきます。
XMLサイトマップの重要性と検証事項
XMLサイトマップとは、サイト内のURLをリスト化したXML形式のファイルです。Googleをはじめとした検索エンジンのクローラーは、XMLサイトマップを読み込むことで効率的にURLをクロールします。XMLサイトマップがなくても、各ページが適切にリンクされていれば、検索エンジンのクローラーは殆どのページを問題なくクロールできますが、数万ページに渡る大規模なサイトや、他からのリンクが不充分な新規サイト(ページ)、ドメイン移行によって大量のURL変更が生じたサイトなど、検索エンジンのクローラーによるクロールが行き渡りづらい状況になったりします。そんな時にXMLサイトマップを記述して設置しておけば非常に役立ちます。しかも、Googleは「XMLサイトマップはクロールする上で重要な存在だ」とも述べており、XMLサイトマップの設置を推奨しています。SEOを考えるならやらない手はないでしょう。
XMLサイトマップ作成における注意事項
というわけで、XMLサイトマップ作成時における方法やTipsです。
- XMLサイトマップにはクロール、インデックス対象のURLを漏れなく記載ください。私は一致率100%を推奨しています。
- noindexを設定していたり、canonical元となるページ、リダイレクト元となるページはXMLサイトマップへの記載は不要です。むしろ記載していると毎回クローラーが来てしまうので(無駄に不要なページをクロールさせてしまうため)除外したほうが良いです。
- XMLサイトマップはGoogle Search Consoleに登録し、robots.txtにも記載ください。BingのSEOを考慮する場合はBingウェブマスターツールにもXMLサイトマップを登録ください。
- ページ追加、更新、削除に応じてXMLサイトマップも更新ください。自動でXMLサイトマップに反映さえるようにシステムが組めれば便利です。
- 1つのXMLサイトマップに50,000URLまで記載できます。(50,000URL以上の場合や管理上の理由で)複数のXMLサイトマップにする場合はサイトマップインデックスファイルにまとめ、サイトマップインデックスファイルからそれぞれのXMLサイトマップのURLを記載し、Google Search ConsoleにはサイトマップインデックスファイルURLを登録します。
- 画像や動画の自然検索流入が見込める場合は、画像・動画専用のXMLサイトマップを作成することも有効です。
- サイトが多言語対応している場合は、XMLサイトマップを使って多言語ページの正規化(アノテーション設定)をすることもできます。
- 優先度を表す<priority>や更新頻度を表す<changefreq>はGoogleが加味しない項目であるため、設定不要です。最終更新日を表す<lastmod>の設定は有効で、Googleは前回のクロール以降に<lastmod>の日付が更新されたページを優先的にクロールしようとします。ただし、事実と異なる日付が<lastmod>に設定されている場合、Googleはその設定を無視しますし、極々僅かな更新程度でも無視します。ページ内容に大きな変更や重要な要素の変更があった場合のみ<lastmod>の日付を更新するようにしましょう。
以上です。XMLサイトマップ作成時には是非ご参考ください。