Google Search Console(以下:GSC)のインデックス状況にcanonical元のページが出てきたりして急に「あれ?何か間違った?」と不安になるケースもありますよね。GSCのインデックスに関する表示方法や解釈方法も変わってきている印象も受けますし、実際にGSCで表示されている内容とGoogle検索の内容が異なることもあるので何とも言えません。ただ、ひとつ言えることとしましては「canonicalは強制的な指示シグナルではない」ということです。
そこで今回は、こういう(以下の)感情や悩みの人に向けた参考情報として私からご紹介したいと思います。
- えっ?canonical入れているのに元のページがインデックスされてるじゃん!?
- せっかくだから、インデックスしたいページにcanonical元のページランクを送りたくて設置しているのに。
- でもcanonical元のページはユーザーには見てほしいからリダイレクト設定はできないのよ。
- でもcanonical元のページがインデックスされるくらいなら、noindex入れてGoogle検索には見せないようにしよう。
- あれ?canonicalとnoindexを同時に入れたらどっちが優先されるんだろう。
つまり、canonicalとnoinexを両方入れたらどうなるか、という話です。あると思います(笑)。
canonicalとnoindex
canonicalとは、Google検索に対して正規のURL(Google検索に優先表示したい本来のURL)を指し示すシグナルです。いわば“ここのページではなく、あっちのページを見て”というシグナルです。canonical元となるHTMLの<head>内に以下のようなタグを入れます。
対して、noindexとは、Google検索に対して該当ページを検索結果から除外してほしい時、googlebotに向けてインデックスさせないことを強制するシグナルです。いわば“このページはクロールしても良いけど、インデックスは禁止”というシグナルです。該当するページの<head>内に以下のようなタグを入れます。
ちなみに、Googleだけでなく、noindexをサポートしている検索エンジン全てを対象とする場合は、name属性をgooglebotではなく、robotsにします。
はい、ではこのcanonicalとnoindexを同じHTMLの<head>内に記載したら、Googleはどちらを優先するのでしょうか?
結論:どうなるか
結論は、どうなるか分からないです(笑)。ケースバイケースです。海外SEO情報ブログにも記載されていますし、鈴木氏から直接Mueller氏にも確認したようですが、Googleの解釈は曖昧のようですね。
試しに、私のほうで任意のサイトページの<head>内に両方記載をし、canonicalとnoindexの記載順序を変えたりもしてみましたが、noindexすることもあればcanonicalすることもあり、事実としては色々なパターンになりそうです。といっても、私の実験においてはコンテンツの品質も高いとは言えませんでしたので(だからこそ実験できたのですが…)、コンテンツの品質が悪いからそもそもインデックスされなかったということも考えられまして…明確に公平な状況でテストができたとは言えませんし、できるとも思えません。
ギリギリ言えることとしては、少なくとも<head>内の記述順序はそこまで影響しないということですかね。まぁ、海外SEO情報ブログ内でも「矛盾するようなシグナルを送るのは非推奨」という言い方をしていますし、正直併用はあまり良い方法ではないと思います。しかし、それによってGooglebotが混乱するだけで、何かマイナスが起こるというわけではありませんので、冒頭でご紹介した動機で併用する人を断罪するような言い方もできませんが。
“canonicalが効かない時の次なる手”として考えることもあるようですが、(私と考えとしては)やはりそれもサイト戦略においてどういうページ間において生じた局面なのかによって管理方法が変わると思います。ですので、私であれば…そもそもそういう事態になった経緯と状況から判断し、そのうえでコーディング方法をご進言すると思います。ここで明確な推奨方法の記載は避けておきますね。ちなみに、Googleにコンテンツを読ませない方法については、本ブログの別ページをご覧ください。
というわけで、何かございましたらご相談ください(笑)。