XMLサイトマップとRSS/Atomフィードが必要な理由

Googleのウェブマスター向け公式ブログにて「XMLサイトマップとRSS/Atomフィードのベストプラクティス」という記事が挙がっていました。かなり分かりやすく記載されていたので、ここでもご紹介しておきます。

気軽にお読みください

XMLとRSS/Atomが必要な理由

記事の中では簡単にこの両者の違いについて紹介していました。

・XMLサイトマップは一般的にファイルサイズが大きくなります。一方、RSS/Atomフィードのファイルサイズは小さく、サイトの最新の更新情報のみが含まれます。
・XMLサイトマップはRSS/Atomフィードほど頻繁にダウンロードされません。

 
こういう概念で捉えておくと、どちらも必要であることは明白ですね。昨今のGoogleのTwitter連携やらGoogle Nowやらの強化を考えますと、情報の鮮度と”今”感は常に意識した方が良さそうです。更新の重要性を裏付けるような説明もされていました。

XMLサイトマップとRSS/Atomフィードは、実際のところ、メタ データが付加されたURL の一覧です。その中で、Googleにとって最も重要な情報は、URLそのものとその最終更新日時です。

 
重要なフィールドとして紹介されていますので、最終更新日時は意識すべきですし、サイトが生きている証拠にもなるのでしょう。

記載するURLでよくあるミス

XMLやRSS/Atomに記載するURLにおける注意点に関しても以下を促しています。

Googlebotが取得可能なURLであること。robots.txtによってGooglebotのアクセスを禁止しているURLや、ページが存在しないURLが指定されているケースがよく見られますが、それらは間違った指定方法です。
正規URLであること。内容の重複した複数のページのURLが指定されていることがありますが、これは間違った指定方法です。そのままでは、インデックスが改善されない一方で、あなたのサーバーの負荷が増大してしまいます。

 
だそうです。実際に私が企業サイトのXMLサイトマップを見ていると、XMLに記載するURLにcanonicalで正規化をしている(重複している)パラメータ付きを掲載していたり、情報が古く実際のファイル数より大幅に少ないケースが散見されます。これは自動でXMLサイトマップを吐き出すツールを使うことで、意図せず重複したURLだったり、最終的に目視確認していない証拠だと思われます。意外と軽視しているサイト運営ご担当者様が多いのも事実のようです。

ふわふわ

詳細についての記載のしかた等に関しては、冒頭のリンク先よりご確認ください。今回は結構わかりやすく書いてありました(笑)。

私がWebMasterToolを使って内部分析をする際には、必ずインデックスステータスを確認します。ファイル数や意図している通りにしっかりインデックスされているか確認するためにもXMLサイトマップの正確な記載と、RSS/Atomフィードの設定を行うようお願いします。