トップページがインデックスから削除された!?

インデックスページが削除される原因と対処方法

『アクセスが急激に落ちてる?!』

なぜ??

調べたらトップページへのアクセスが急減している!

大変だ!!

慌ててアクセスが急減した原因を調べてみると、「トップページが検索結果から削除されていた!!」

baby

といったことに遭遇したことはありませんか?

突然インデックスされているページが検索結果から消えてしまったら、アクセスが途絶えてしまうので一大事です。

下層ページであればまだダメージは少ないですが、トップページがインデックスから削除された場合売上に大きく影響する恐れがあります。

あなたのサイトは大丈夫ですか?

そもそもインデックスとは

インデックスとは、「検索エンジンが自身のデータベースにWebページの情報を整理・登録すること」を言います。

本棚に置いてある本をイメージしてみましょう。

本棚にただ本を並べてあるだけでは、何の本が置いてあるのか探しにくいと思います。

「何か」を頼りに探すはずです。

何でしょうか。

書店では「あいうえお順」「出版社別」「作家名」「ジャンル」といったラベルを頼りに貼って分かりやすく整理していますね。

library

自分が欲しい本が含まれていそうなラベルを頼りに、素早く本を見つけることができます。

これと同じ仕組みを検索エンジンも行っています。

つまり検索エンジンは、「●●(検索したキーワード)に対応するサイトはどのようなのがあるか」を事前に整理しているのです。

事前に整理・登録をしているからこそ瞬時に検索結果が表示されるようになっています。

言い換えると、インデックス(登録)されていないサイトは検索結果には表示されないということになります。

検索結果に表示されない原因

インデックスの削除を確認したら、まずは原因を究明することが最優先です。
慌てずに対処していきましょう!

インデックスが削除されてしまう主な原因は2しかありません。

①ペナルティを受けてしまった
②手作業によってインデックス削除してしまった

どちらの状況下においても調べる内容や手順はほぼ同じですので、原因を探っていきましょう。

light

インデックス削除の原因と確認方法

それでは、確認方法をご紹介します。

インデックスされているかを再度確認

「site:https://sample.com(ここまでは任意のURL)」と検索を行い、インデックスされているかどうかを確認します。

表示されたURLの一覧にTOPページが存在してなければインデックスはされていません。

重複ページ(コンテンツ)があるかを確認

トップページの重複コンテンツが存在している場合でもトップページがインデックスから削除されることもありますので確認してみましょう。

URLの正規化を確認

URLが正規化できているかは下記の違いに注意してください。

・http~、https~の違い
・URLの末尾に/index.html(index.php)の有無
・wwwの有無

info:URL(今回はトップページ)で検索した結果を見る

site:URL(今回はトップページ)+ “タイトル” で検索した結果を見る

Google Search Consoleの「HTMLの改善」項目から調べる

「info:URL」によって、該当ページがインデックスされているかを知ることができます。万が一、異なるURLが表示されたらその該当ページを疑ってみてください。

robots.txtを確認

「https://sample.com(ここまでは任意のURL)/robots.txt」と記載することでまずrobots.txtの有無を確認してください。

robots.txtファイルに、「 Disallow: / 」と記述されていたら、そこが原因です。

Disallowは、検索エンジンに巡回しないで欲しいと明言するための記述です。
Disallowの記述があったら何かしらのファイルを「クロールしないでください」と伝えていることになります。

ちなみに、「Disallow: / 」はトップページ以下のページ、つまりサイト全体をクロールしないでくださいということになります。

特に新規のサイト公開時やリニューアルのタイミングで、注意が必要です。記述を削除しないまま公開しないよう、注意してください。

noindexの記載の有無を確認

ソースコード内に以下の記述がある場合はインデックスされません。

 <meta name="robots" content="noindex">

noindexは文字の通り、検索エンジンにインデックス(index)しないで欲しい(no)と伝える記述です。

お使いのCMS次第ではボタン一つでnoindexをいれられる場合がありますが、簡単であるが故に意図せずnoindexタグが入ってしまうこともあるので注意しましょう。

.htaccessでアクセスが制御されているか確認

.htaccessはサーバー制御を行うファイルです。

リダイレクト(転送)処理を行ったり、特定IPアドレスからのアクセス制御を行ったりと便利なファイルなの
ですが、指定内容を誤ると正常に稼働しなくなります。
誤った転送でトップページを表示できなくしてしまったり、検索エンジンのトップページへのアクセスを制御してしまうと、インデックスされなくなってしまいます。

Googlebotがサイトに巡回しに来ているかを確認

Googleからのアクセスを遮断してしまっていないかはGoogleSearchConsoleで確認できます。

「不正アクセス防止で海外IPの接続を遮断・サーバーエラーでGoogleがアクセスできない」
上記のような状況になると、Googleは巡回してくれません。

 ※Google Search Consoleの「クロール」→「クロールの統計情報」から、検索エンジンのアクセス状況を確認できます。正しく巡回されているか確認する際に便利です。

手動のペナルティを受けていないか確認

ドメイン単位で何らかのペナルティを受けてしまっている恐れがあります。
Google Search Console上にペナルティのメッセージが来ているとそちらの修正内容を元に改善すれば解決できます。また、オールドドメインを利用している場合にはそのドメイン自体にペナルティを受けてしまっている可能性があります。

 ※Google Search Consoleの「検索トラフィック」→「手動による対策」から、手動のペナルティを受けていないか確認することができます。

canonicalタグを確認

 canonicalタグを使用して、別のURLに正規化の設定をしていないか確認しましょう。トップページが認識されず、別URLが評価対象となり、結果トップページがインデックスされなくなる恐れもあります。一度、ソースコードを確認することをお薦めします。

まとめ:基本的にページはインデックスされるようになっている

robots.txtやcanonicalタグの設定、ペナルティを受けているといったことがない限り基本的にページはインデックスされるようになっています。

study

もっと細かいことを言うと、巡回速度の違いによってインデックスされるタイミングの早い遅いはありますが、Googleをはじめとする検索エンジンは、どんなサイトでも時間が経てば巡回し、評価に値すると判断すればインデックスするようになっています。

特にGoogleにおいては、Google Search Consoleのように申請を出すことも出来る配慮までされています。

とても親切ですね!

そんな中で、元々インデックスされていた状態からトップページだけ、あるいは該当ページだけがインデックスから削除されるケースの原因は2つしかありません。

①ペナルティを受けてしまった
 質の悪い外部リンクの購入や悪質なスパム行為と判定されるような施策を施していないかを確認しましょう。

②手作業によってインデックス削除してしまった
 検索エンジンに対して巡回できない設定やインデックス削除設定を行っていないか確認しましょう。 

そのため、急にインデックスから削除されてしまった日を起点に修正した内容と日付を照らし合わせながら確認することが最も簡単な解決方法です。

site:URLでインデックスされているページ
info:URLで正規化されているページ

上記でそれぞれの状態を判断できますので、原因を究明する作業に活用してみてはいかがでしょうか。

お気軽にお問い合わせください。

WEBマーケティング以外の事でも、お気軽にどうぞ。ジオコードは楽しいこと、面白いこと、何でも挑戦します!

本社:03-6274-8081 支社:06-6377-0395

お問い合わせ

ページの一番上へ