Googleは米国現地時間7月20日、Google検索がURLに求める命名規則について、推奨/非推奨を明記したドキュメントをもう少しブラッシュアップしたことを発表しました。追記した部分が日本語版に対応していなかったりもしていますので、英語版のみの部分を和訳しつつ改めてご紹介したいと思います。
- July 20:Based on user feedback, we clarified what characters Google Search supports in URLs.
7月20日:ユーザーのフィードバックに基づき、URLに関してGoogle検索がサポートする文字列を明確にしました。
Googleが推奨するURLの命名規則について
Webサイトを構築する上でページURLをテキトーに考える人もいらっしゃるかもしれません。しかし、知らず知らずのうちにGoogle検索が非推奨としているURL名やインデックスしづらいURL名を設定してしまっていることもあります。そういった人のためにGoogleが推奨しているURLの命名方法と非推奨の命名について紹介しています。
ちなみに、2023年7月25日現在、英語版には記載されているものの、日本語版には記載されていない箇所が3つございましたので、先にそこだけご紹介しておきます。
引用)URL structure best practices for Googleの冒頭箇所を和訳
- シンプルなURL構造にしましょう。URLは論理的に、そして人間にとって最も分かりやすい方法で構成されるように、コンテンツを整理するようにしましょう。
引用)URL structure best practices for Googleの最終セクションの箇条書きの最初の項目を和訳
- URLの大文字と小文字とを区別しないサーバーの場合(Windowsサーバーでは区別されない)は、(わざわざURLを大文字・小文字で使い分けて記載せずに)大文字・小文字のどちらかに全て一貫したURLに(変換)してもらうと、Googleにとっては同じページとして判断しやすいです。
引用)URL structure best practices for Googleの最終セクションの箇条書きの4番目の項目を分かりやすく書き換えて和訳
まぁ、陽はUTF-8でエンコードされていることと、ファイル内容を推察しやすいような簡潔な語句を使うことと、大文字小文字が入り混じったファイル名はやめてくれ、という話ですね。
以上を踏まえてGoogleが推奨/非推奨するURL名をご紹介します。
推奨URL(問題ないURL)
- シンプルで内容が分かりやすい語句をURLにする
- 各言語での語句をURLにする(例:tenshoku 等)
- 必要に応じたUTF-8 エンコードURL(例:%E6%A4%9C%E7 – URLバーでは日本語になる文字)
- 絵文字のUTF-8 エンコード使用(例:%F0%9F%A6%99 等)
- 国別のドメイン(例:https://example.jp 等)
- gTLDでの国別のサブディレクトリ(例:https://example.com/jp 等)
- ハイフンを使う(例:green-dress 等)
非推奨URL(問題のあるURL)
- 非ASCII文字をURLにする(UTF-8 エンコードを使用していない – 例:fuwafuwa.biz/日本語 等)
- 意味のない長いID番号のURL(例:index.php?id_sezione=360&sid=3a5ebc944f41daa6 等)
- アンダースコアを使う(例:green_dress 等)
- URL内の単語を繋げる(例:greendress 等)
他にもGoogleでは不要なパラメータを非推奨としており、セッションIDは膨大な数の重複とURLを生成するセッションID、内容を並び替えるだけのパラメータ、動的なドキュメントに繋がるパラメータ、参照パラメータ、日付が無駄につくパラメータ、破損した相対リンク等を例に挙げています。
ご注意ください
私もアンダースコア(_)が非推奨だったとは露知らず…。また、Googleはパラメータ付きURL自体を非推奨にはしていないものの、動的なパラメータや不要なパラメータ、自動大量生成パラメータ等は非推奨にしていますので、お気を付けください。また、この辺は、Search Consoleでのインデックス状況からGoogleが意図してインデックスしなかったURL等で確認できますのでお試しください。
内容を推察しやすく簡潔なURLが一番ということですね!