インデックスされていない記事(ページ)を割り出す方法、及び改善案を解説しています。
作った記事コンテンツがインデックスされていないと、該当記事のみならずサイト全体の品質が悪化する原因となるので、インデックスされていないコンテンツがあれば早期に発見し改善につなげてくださいね。
インデックスされていないページを確認する方法
Google Search Console(以下、サーチコンソール)を利用する方法、利用しない方法とあります。
インデックスされている・されていないの確認に限らずサイト運用においてGoogle Search Consoleは登録しておいた方が良いので、登録がまだの方は以下を参考に登録をお試しくださいね。
1、サーチコンソールを利用する場合
サーチコンソールを利用する場合、「URL検査」と「カバレッジ」の2通りから対応が出来ます。
「URL検査」からの確認する方法
- Google Search Consoleにログイン
- URL検査をクリック
- 確認したいページのURLを入力
インデックスされていない場合、URLがGoogleに登録されていません(インデックスがされていない)と表示してくれます。
「カバレッジ」からの確認する方法
- Google Search Consoleにログイン
- 「カバレッジ」をクリック
- 「除外」だけチェックを入れる
インデックスがされていない場合、その旨を表示してくれます。
特にカバレッジを駆使した確認方法の場合、インデックスされていないだけでなく、インデックスされないURLの「エラーの原因」や「どのページがインデックスされていないのか?」も表示してくれるのでとても便利です。
エラー候補の項目をクリックすると該当となるページ詳細が分かります。
2、サーチコンソールを利用しない場合
Googleの検索エンジンの検索窓に「site:自分のサイトURL」を記入して検索
Googleの検索エンジンにインデックスされている自分のサイトの各ページが表示されます。
厳密にはインデックスされていないページの確認ではなく「インデックスされているページを確認することで、逆算的にされてないページを発見する方法」というのが正しい言い方となります。
なお、「site:自分のサイトURL」で調べた結果は完全に正しいわけではありません。「おおよそ」の結果を表示してくれます。よって、正確にチェックしたいならサーチコンソールから確認した方が良いです。
3、XMLサイトマップから確認
クローラーはXMLサイトマップに登録されているURLを元にインデックスするためXMLサイトマップに自分のサイトが登録されているかどうか?を確認します。
XMLサイトマップを作成しておけば「https://(自分のドメイン名)/sitemap.xml」でサイトマップが確認できます。
そもそもXMLサイトマップに登録されていないのではないか?を確認しましょう。
XMLサイトマップの作成はプラグインを使えばすぐ(1分ぐらい)ですので、設定がまだの方は以下を参考にXMLサイトマップを取り入れてみてくださいね。
ワードプレスにインデックスされない理由
1、サイトの質が低い
サイトに変更頻度が低い情報がある場合や、サイトの品質があまり高くない場合は、サイトのクロール頻度が落ちる可能性があります。サイトを率直に見て、またサイトに関係がないユーザーに偏りのない意見を聞いて、全体的にサイトのどこをどのように改善すればよいかを検討してください。
新しい情報を大量に追加した場合や、サイトに非常に有用な情報が掲載されている場合は、想定を上回ってクロールされてしまう可能性があります。
クロールの統計情報レポート(ウェブサイト) – Search Console ヘルプ
サイトの質には明確な定義が無いので判断が難しいのですが、自分の体験上「狙ったキーワードに対して検索意図に沿った答えをコンテンツで用意できていない場合インデックスされにくい」という傾向があるので、=質が低いと考えています。
検索キーワードに対してユーザーに満足してもらえる記事コンテンツ作成を目指して、常にサイト運営をしましょう。
具体的に「この記事は質が悪いよ!」と警告されている記事を見分けるには以下の方法が良いです。
「検出-インデックス未登録」と「クロール済み-インデックス未登録」
上述した手順でインデックスカバレッジを確認し、「検出-インデックス未登録」もしくは「クロール済み-インデックス未登録」と表示されていたら該当です。
これは、検索エンジンがクロールはしているがインデックスには登録させていないよ、という状態です。
言い換えると「わかっちゃいるけどインデックスさせる価値が無いのでインデックさせませんよ=品質が悪いよ」ということです。
他にもURLをサイトマップで送信しただけで、サイト内のどこからもリンクされていない場合でも起こりやすいですが、基本的には該当記事コンテンツの品質が悪いことで起こりやすいです。
よって、「検出-インデックス未登録」や「クロール済み-インデックス未登録」の表記を確認したら記事をリライトして品質を高めてください。
【次回予告】
品質を改善するためのリライト方法【具体的な手順で解説】
インデックス登録されましたが、サイトマップに送信していません
カバレッジから「有効」だけチェックを入れます。
「インデックス登録されましたが、サイトマップに送信していません」と表示されていたら該当です。
これは、インデックス自体は行ったけどサイトマップ送信以外の方法でGoogleがインデックさせました、という状態です。
XMLサイトマップ登録がまだの時に起こりやすいので、XMLサイトマップの設置がまだの方はプラグインを使ってサクッと登録させておきましょう。
本記事前半でもご紹介しましたがXMLサイトマップの登録は「XMLサイトマップとRSSフィード(feed)を作成する方法」の記事を参考にお試しくださいね。
厳密にはインデックスされているので過度に心配する必要は無いのですが、経験上このタイプでもネガティブな影響を受けた経験があったので記載させていただきました。
2、ペナルティを受けている
Googleのガイドライン違反によりペナルティ対象となっている
次のような手法を使用しないようにします。
コンテンツの自動生成
ウェブマスター向けガイドライン – Search Console ヘルプ
リンク プログラムへの参加
オリジナルのコンテンツがほとんどまたはまったく存在しないページの作成
クローキング
不正なリダイレクト
隠しテキストや隠しリンク
誘導ページ
無断複製されたコンテンツ
十分な付加価値のないアフィリエイト プログラムへの参加
ページへのコンテンツに関係のないキーワードの詰め込み
フィッシングや、ウィルス、トロイの木馬、その他のマルウェアのインストールといった悪意のある動作を伴うページの作成
構造化データのマークアップの悪用
Google への自動化されたクエリの送信
上記を確認して『あれ!?該当する行為が自分のサイト運用にあるぞ。汗』となれば修正・改善しましょう。
既にペルティを受けてる中古ドメインを使っている
高度な経験者でなければ該当しませんが「中古ドメイン」という、以前に誰かが使っていたドメインを意図的に使うサイト運用もあります。
ですが、中古ドメインは過去にペナルティを受けてるものもあり、ペナルティを受けている中古ドメインを選んでしまうとどれだけ頑張って良いコンテンツを作ったとしても正当な評価をしてもらえません。
中古ドメインは一種の博打的な要素があるので、基本的には使用を控えた方が賢明です。
3、技術的な問題
サーバーエラー(500エラー)
サイトを運営しているサーバー側の容量が足りずに500エラーによってサイトが閲覧できなくなることがあります。
エラー状態が長く続くとクローラーが上手にクロールすることが出来ないため結果的にインデックスされない、という事態が起こります。エラー対象となるページのサイズを軽くするかサーバー自体をより良いものに鞍替えするか、などで対策しましょう。
とはいえ、個人ブログ運用レベルではめったにないけどね。
「noindex」でインデックスをブロックしている
該当サイト本体、もしくは個別記事にnoindexメタタグが記述されているとインデックスされません。
noindexメタタグは下記のようなタグで、HTMLコードに記述します。
meta name=”robots” content=”noindex”
noindexメタタグはインデックスをブロックする役割を持つので、noindexメタタグを実装してしまうと、どんなにSEO対策をしてもどんなに良いコンテンツを用意しても一向に検索結果に表示されることはありません。
サイトを公開する前のテスト時にnoindextメタタグを使用することがあります。公開後のページにnoindexメタタグが残っていないか?を確認してみてください。
重複コンテンツ扱い
個人ブログ規模ではほぼ関係ありませんが、システムで作られた大規模サイトでよく見られる動きとして、「複数のURLで同じページにアクセスできる」「PCページとスマホページを別のURLで管理している」などの作りをすると、検索エンジンはページが重複していると判断します。
検索エンジンから重複ページとみなされると、その内1つだけが正規ページと認識され、それ以外のページはインデックスされないことがあります。(仮にインデックされてもクロールの頻度が減ったりもします。)
このような場合、索エンジンに正規ページを伝える役割を持つcanonicalタグを使用して検索エンジンに対して優先的にインデックスさせたいURLを指定してあげましょう。
canonical(カノニカル)タグはHTMLコードのタグ内に下記のように記述します。
link rel=”canonical” href=”正規ページのURL”
なお、便利なcanonicalタグですが注意点もあります。
よくある間違いとして全ページのcanonicalタグにトップページが指定されてしまっている、というものです。=「下層ページがすべてトップページの重複にあたる」ことを意味しているため、トップページ以外が重複となるわけです。
そんなことが起こらないように、念のためcanonicalタグのチェックも行いましょう。
最初はインデックスされたのに突然検索結果から表示されなくなった場合
最初は検索結果に表示されたのに数日たったら消えてしまった、ということがあります。
詳しい話は割愛しますが、検索エンジンのインデックのさせ方には「ファストトラックインデックス」と「プライマリインデックス」という二種類があり、立ち上げたばかりの頃は「ファストトラックインデックス」の状態であることがほとんど。
ファストトラックインデックスの状態では順位が安定しないので表示されていた検索結果が消えてしまうこともしばしばあります。
クローラーは複数回に渡りサイトをクロールして、徐々にサイトテーマやコンテンツを理解し順位を安定させていきますので、サイト運用や記事公開の初期段階では順位変動はあまり気にしない方が良いです。
内部リンクを活用しよう
自分のサイト内の各記事ごとに内部リンクを設置しましょう。
内部リンクが全くないような記事はサイト運営上「孤立した記事」となりますが、孤立した記事は『重要でない記事』とみなされやすいので、その結果としてインデックスされにくくなります。
よって、内部リンクを設置することでクローラーがサイト全体に巡回しやすくし、インデックス漏れを防ぎましょう。
内部リンク、(可能であれば)外部リンク、それぞれ設置することでクローラーの巡回が改善しインデックされやすさが向上しますので、こまめに内部リンクを繋げてサイト内の各ページが有機的につながっている状態にしてあげてくださいね。
GoogleのJohn Muellerさん(Googleの偉い人)も「サイトマップで送信しただけでサイト内からリンクが張れていないと、さほど重要でないとみなされ、インデックスされないことがありうる。」と述べてます。
インデックスされないページは「まだ価値が足りないよ!」って考えよう
いろいろと細やかなことを書きましたが、基本的にはインデックスされていない=記事の品質がわるい→もっと頑張って良い記事書きましょ!って覚えておくと良いと思います。
その上で、内部リンクを活用してサイト全体にクローラーが巡回できるようにしておけば概ね怖いことは無いですよ!
インデックス促進させたいときは以下の記事も参考にしてみてね。