Googleのスパム予防案

Googleは米国現地時間5月26日のSearch Central Blogにて、悪質なスパムを喰らってしまったWebサイトページに対しても(検索ユーザーへの悪影響を考え)手動対策していく旨を改めて発表し、同時にその予防策(回避策)としての実践事項を紹介してくれていますので、ご紹介します。

スパム

ふわふわ

悪質なスパマーに捕まらないために

まずはSearch Central Blogの内容の和訳からご覧ください。

サイトの一部がスパムに悪用されるのを防ぐ

サイトオーナーは、フォーラム、ゲストブック、ソーシャルメディアプラットフォーム、ファイルアップローダー、無料ホスティングサービス、内部検索サービスなど、ユーザーと何らかの繋がりを持つ場所をいくつか提供していることでしょう。これらのサービスでは、ユーザーがアカウントを作成してコンテンツを投稿したり、ファイルをアップロードしたり、サイト内を検索したりすることができます。残念ながら、スパマーはこのようなサービスを利用して、Webにほとんど無価値となる何百ものスパムページを大量生成することがよくあります。Googleのウェブマスターガイドラインに記載されている原則に基づき、Googleはこのように影響を受けたページに対して手動対策を行うこともあります。以下に例を挙げます。

下記のようなスパム的なコンテンツは、様々な見地で皆様のサイトやユーザーにとって有害です:

  • Webサイトの一部に低品質なコンテンツがあると、サイト全体のランキングに影響を与える可能性があります。
  • スパム的なコンテンツがあると、マルウェアやフィッシングサイトなど、望ましくない、あるいは有害なコンテンツへユーザーを招く可能性があるため、サイトの評判が下がるかもしれません。
  • スパムにより生成された無関係なコンテンツからの意図しないトラフィックにより、サイトの表示速度が低下したり、無駄なホスティング費用がかかる可能性があります。
  • Googleとしては、検索結果の品質を守るために、第三者が作成したスパムが氾濫しているページを削除したり、ランキングを下げたりすることがあります。

今回のブログ記事では、スパマーによるサイトの悪用を防ぐためのヒントをご紹介します。

自動アカウント作成をブロックする

ユーザーが皆様のサイト上でアカウントを作成する際には、Googleの無料CAPTCHAsサービスや同様の認証ツール(例:SecurimageJcaptcha)を使用して、人間による操作のみを許可し、自動化されたスクリプトによって勝手にアカウントを生成されたり、Webサイトで誰もが見えるプラットフォーム上に勝手なコンテンツを生成されたりするのを防止するようにしてください。
また、新規ユーザー登録時に本物のメールアドレスを使用して認証依頼することで、多くのスパムボットによる自動アカウント作成を防ぐことができます。さらに、疑わしいメールアドレスや、信頼できないメールサービスから送信されたメールアドレスをブロックするフィルターを設定することもできます。

モデレーション機能を有効にする

コメントやプロフィール作成時のモデレーション機能を有効にすることで、リンクが貼られた投稿が公開される前に、信頼に値するユーザーであるかどうかを確認できる設定をご検討ください。可能であれば、匿名での投稿を無許可にする設定を行い、新規ユーザーからの投稿は、一般に公開される前に承認するような設定にしてください。

スパム的なコンテンツがないかサイトを監視し問題があれば取り除く

Search Consoleに登録し、Webサイトの所有権を確認してください。Googleが検出した問題があるかどうかは、セキュリティの問題レポート手動による対策レポートをご確認ください。また、メッセージパネルを確認することで、より詳細な情報を知ることもできます。

さらに、Google検索でsite:検索を使って、サイトの内容と無関係の商業キーワードやアダルトキーワードと一緒に検索して、予期しないコンテンツやスパムコンテンツがないかどうかを時々チェックすることもオススメです。例えば、[site:あなたのドメイン名 バイアグラ][site:あなたのドメイン名 オンライン視聴]と検索すると、あなたのサイトにある無関係なコンテンツ――特に以下のようなものを検出することができます:

  • 文脈を無視したテキストや、第三者のWebサイト/サービスを宣伝することだけを目的としたテーマ外のリンク(例:無料映画ダウンロード/オンライン視聴)
  • 意味の通らない適当なテキストや、自動的に生成されたテキスト(実際のユーザーによって書かれたテキストではない)
  • 第三者のWebサイトやサービスの宣伝を目的とし、ユーザーのクエリに対してWebサイトのテーマが合っていないサイト内検索結果画面

Webサーバーのログファイルを監視し、新しく作成されたページのトラフィックが突然増えていないかどうかもご確認ください。例えば、あなたのWebサイトとは全く関係のないキーワードがURLパターンに含まれていないかを調べます。トラフィックも多く、問題のありそうなURLを特定するには、Google Analyticsの「ページレポート」をご活用ください。
スパム用語のリストを参考に、明らかに不適切なコンテンツがあなたのプラットフォームに公開されていないことをご確認ください(例:ストリーミングやダウンロード、アダルト、ギャンブル、医薬品関連の用語など)。補助機能やプラグインを使えば、これらのコンテンツを削除したり、スパムとしてマークすることができます。
もうひとつの優れたツールとして、Googleアラートがあります。[site:あなたのドメイン名 スパム用語]などでGoogleアラートを設定し、自分のサイトで見覚えのない営利目的のキーワードやアダルトワードが出てこないか確認しましょう。また、Googleアラートは、ハッキングされたページを検出するのにも最適なツールです。

スパムアカウントの特定と排除

ユーザーのサインアップに関するWebサーバーのログを監視し、次のような典型的なスパムのパターンを特定しましょう。

  • 短時間に大量のサインアップフォームが送信されている
  • 同じIPアドレスから大量にリクエストされている
  • サインアップ時に、想定外のユーザーエージェントが使用されている
  • サインアップ時に、無意味なユーザー名や値を使用している。例えば、実在する人間の名前ではない商業的ユーザー名(「Free movie download」のような名前)や、無関係なサイトへのリンク

信頼できないコンテンツにGoogleが表示や追跡をしないために

あなたのサイト上で、ユーザー主導でプロフィールページやフォーラムのスレッド、Webサイトなどの新規ページを作成できる場合、Google検索が新しいコンテンツや信頼できないコンテンツに対して表示や追跡をできないようにすることで、スパムの悪用を防止することができます。

例えば、noindexメタタグを下記のように使用すれば信頼できないページへのアクセスをブロックすることができます。

<html>
 <head>
  <meta name=”googlebot” content=”noindex”>
 </head>
</html>

また、robots.txtファイルを使って、一時的に特定のページをブロックすることもできます。

Disallow: /guestbook/

また、コメントやフォーラムへの投稿など、ユーザー生成コンテンツ(UGC)を、rel=”ugc”rel=”nofollow”を使うことでUGCとしてマークすることもできます。これにより、リンク先のページとの関係をGoogleに提示し、Googleにそのリンクを辿らないよう要請することができます。

オープンなプラットフォームのコンテンツを、ファイルパスやディレクトリ単位でまとめる

スパマーは自動化されたスクリプトやソフトウェアを使うことで、短時間のうちにあなたのサイトに大量のスパムページを生成することもできてしまいます。このようなコンテンツは、断片的なファイルパスやディレクトリでホストされているものがあり、サイトオーナーがスパム検出したり排除したりする上で、効率化しづらい状況になります。例えば次のようなものです:

example.com/best-online-pharma-buy-red-viagra-online
example.com/free-watch-online-2021-full-movie

そこで、メンテナンスやスパム検出を容易にするために、ユーザー生成コンテンツをファイルパスやディレクトリ単位でまとめることをおススメします。例えば、以下のようなファイルパスを挟むことを推奨します。

example.com/user-generated-content-dir-name/example01.html
example.com/user-generated-content-dir-name/example02.html

Webサイトのソフトウェアを常時最新にし、自動システムでサイトを守るには

時間をかけてでもソフトウェアを最新の状態に保ち、重要なセキュリティアップデートの際は、特に注意を払う必要があります。スパマーは、ブログや掲示板、その他のコンテンツ管理システムの古いバージョンに残る、セキュリティの課題を悪用することがあります。
また、Akismetのような総合的なスパム対策システムには、多くのブログやフォーラムシステムに対応したプラグインがあり、簡単にインストールでき、スパム対策のほとんどを代行してくれます。さらに、プラットフォームの中には信頼できる有名なセキュリティプラグインが用意されており、Webサイトをすぐ停止できたりして不正使用を早期発見できるようにもなります。

皆様のサイト状況に応じて、詳細な情報を以下ドキュメントでご確認ください。

ご不明な点がございましたら、Search Centralヘルプコミュニティをご利用ください。

引用)Search Central Blogより和訳

スパムは色々なパターンがあり、特にユーザーが干渉できるWebサイトを運用しているサイトオーナーにとっては脅威です。スパムアタックはWebサイトの人気度に比例して多くなるものです。そこで、Googleからサイトオーナーにこまめにチェックできるようなスパム予防策をいくつか作業単位で教えてくれています。

ふわふわ

ある程度のプラットフォーム運用している人は特に注意

ユーザー投稿で成立するサービスは特に注意が必要です。オープンになっているコミュニティやサロン、掲示板等は非常に分かりやすいでしょう。しかし、それ以外にも問い合わせ窓口やフォームを設けている場合も気を付けなければなりません。GoogleのreCAPTCHAサービス等は非常に有効ですし、無料なので便利です。

問い合わせフォームから一度でもスパム入力を受けてしまうと、その後も半永久的にスパム入力され続けるケースが多く、宛先の設定変更まで余儀なくされることにも繋がります。色々面倒くさいですが、こういったスパムは国境を跨いで世界レベルで攻撃されますので、充分に注意して運用していきましょう。


関連記事

Search Console Insightsがリリース

2020年8月にSearch Console Insightsのベータ版がリリースされていました。私はベータ版の対象者になっていたので、当時は詳細を紹介していました。これが米国現地時間2021年6月15日に正式にリリース紹介されましたので、あらためてご紹介します。ここ数日間をかけて徐々にロールアウト ...(続きを読む)

SEOが不要になる

私の個人的な意見です。個人的な意見というのは、確証が無い憶測での記事ということですので、ゆる~い感じでご覧いただければと思います。 SEOとはSearch Engine Optimizationの略で「検索エンジン最適化」の訳ですが、このSEOについて、何か特別なマークアップ以外はもう考えなくて良く ...(続きを読む)

GSCのクエリフィルタリング機能更新

先日、Google Search Console内での検索パフォーマンスで正規表現フィルタが新機能として実装されたことをご紹介しましたが、その後この機能がアップデートされたと米国現地時間6月1日にGoogleは発表しました。発表内容は日本語ですが、ここでもご紹介します。 Googleからの発表内容 ...(続きを読む)

202106コアアップデート

Googleは米国現地時間6月2日にコアアップデートを行うことをツイートしました。前回が米国現地時間2020年12月3日でしたので、約半年後の告知となっています。コアアップデートの度にGoogleは2019年8月のブログ記事を引用して発表していますが、その記事の和訳は私のブログでこちらに記載していま ...(続きを読む)

コメントを書く

コメントは承認から反映までしばらく時間がかかる場合がございます。メールアドレスが公開されることはございません。