• タイトル言語を一致させるアルゴリズム

タイトル言語を一致させるアルゴリズム

Googleでは、米国現地時間6月3日、タイトル言語を本文の言語に合わせて書き換えるアルゴリズムを導入したことをSearch Central Blogで発表しました。要はtitleタグでは言語が異なっていても、本文内の言語に合わせて検索結果の表示タイトル言語を書き換えるぞって話です。

Googleからの説明内容

まずは以下、Search Central Blogでの記事を和訳してご紹介しますが、例がヒンディー語なので分かりづらいかもしれません…。

主要なコンテンツとタイトルで使う言語が異なる場合のタイトル生成方法

今回、ページの主要コンテンツと異なる言語や文字でtitleタグが書かれている場合、そのドキュメントを識別し、ドキュメント言語や文字に類似したタイトルを生成するアルゴリズム改良についてご紹介します。これは、タイトルはページの主要コンテンツ言語に合わせて書かれるべきという一般常識に基づく改良です。また、検索結果のタイトルにtitleタグ以外の情報を使用する理由のひとつでもあります。
 

多言語タイトル

多言語タイトルとは、同じ文言を2つの異なる言語で繰り返し表記している状況です。最も一般的なパターンは、元の言語のタイトルテキストに英語版も追加している場合です。
 
गीतांजलि की जीवनी – Geetanjali Biography in Hindi
 
この例では、タイトルは(ハイフンで区切られた)2つの要素で構成されており、同じ内容を異なる言語(ヒンディー語と英語)で表現しています。タイトルは2つの言語で書かれていますが、ドキュメント自体はヒンディー語のみで書かれています。Googleのシステムではこの一貫性が欠如している状態を検出し、ヒンディー語の見出し文だけを以下のようなタイトルに使うようにします:
 
गीतांजलि की जीवनी
 

ラテン語表記のタイトル

翻字とは、特定の言語を記した文字表記を、別の文字による表記に書き換えることです。例えば、ヒンディー語で書かれた歌のページタイトルが、ヒンディー語本来のデーヴァナーガリー文字ではなく、ラテン文字に翻字されている場合を考えてみましょう:
 
jis desh me holi kheli jati hai
 
このような場合でも、Googleのシステムでは、ページ本文内でメインとして使用されている言語で代替したタイトルを見つけようとします、例えると次のようになります:
 
जिस देश में होली खेली जाती है
 

まとめ

通常は、Googleのシステムではページのtitleタグをタイトルに使用する傾向があります。しかし、多言語や翻字されたtitleタグの場合、ページの主要言語に一致する代替のタイトルにしようとします。そのため、ページの主要コンテンツの言語表記と一致するtitleタグにすることを推奨します。
このトピックに関する英語日本語のスレッドもそうですし、フォーラムでの追加ご意見をお待ちしています。

引用)Search Central Blogより和訳

2021年9月にタイトルを自動生成するアップデートを行い、先日私なりのtitleタグの記載をご紹介しましたが、タイトル生成アルゴリズムのひとつとして言語の統一化を図るようです。
 
今回は、Googleの記事内に挙げた例が、私たち日本人には非常に馴染みづらいですよね(笑)。そこで、私の方で日本語と英語を例にしてご紹介します。ページ本文内言語とtitleタグの表記内容とその場合のGoogleによる検索結果のタイトル表記を表にしてみました。

ページ本文内の言語 titleタグに記載した内容 Googleによるタイトル表記
英語で書かれている Hurry Up! – 急げ! Hurry Up!
英語で書かれている ハリーアップ! Hurry Up!

 
上段は多言語タイトル――つまり、複数の言語でtitleタグ表記した場合、下段は翻字タイトル――つまり言語をそのまま母国文字等でtitleタグ表記した場合、のそれぞれの例です。我ながら分かりやすいと思いますが…どうでしょうか。

英語と日本語の場合は微妙?

今回はアルゴリズムとして、“そういう働きがある”というわけですので、必ずしも書き換えが起こるとは限りません。また、日本語と英語の場合、ほとんどの日本人には同じように意味が分かってしまいますので、Googleによる書き換えはかなり曖昧になりそうですよね。

ただ、Googleが意図している背景は非常に良く分かるので、titleタグを記載する際は本文内の大部分を占める言語で捉えると良いかもしれません。

カテゴリー

新着記事

人気記事

過去記事