検索エンジン「インデックス」とSEO

インデックスとSEO

「インデックス」とは、
ウェブページの情報が、検索エンジンにデータ化されて保存されることをいいます。

検索エンジンにインデックスされることではじめて、検索結果に表示される可能性が生まれますし、サイト全体の評価にもつながりますので、極めて重要です。

このページでは、インデックスの仕組みと、効果的なSEO対策について
分かりやすく、実践的に解説してまいります。

このページのポイント

  • インデックスとは、webページ情報が検索エンジンにデータ化され保存されること
    (タイトルタグなどのメタ情報、コンテンツ、画像・動画、リンクなど)
  • インデックスされることで、検索結果に表示される可能性が生まれる
    (インデックスされないページは、検索結果に表示されない)
  • インデックスされるには、質の高いコンテンツが必要
  • インデックスされないページが多いと、サイト全体の評価が下がる
  • インデックスされなかったときの対策について
    (インデックスを促す方法とは?)

検索エンジン「インデックス」とは?

検索エンジン「インデックス」とは、
検索エンジンがWebページの情報を収集し、データベースに登録することをいいます。

ネット上には膨大なウェブページが存在しており、ある意味、玉石混交状態です。

この膨大なウェブページの中から、「検索結果として表示する可能性がある」ページを、データ化して保存することを「インデックス」というわけです。

ですので、せっかくページを作成したとしても、インデックスされなければ、検索結果に表示されることはなく、
ネット上に存在していても、検索結果として表示されることは「ない」のです。

検索エンジンの「インデックス」流れ

検索エンジンが「インデックス」する流れを見て行きましょう。

1.クローラーがWebページを巡回

検索エンジンの「クローラー」が、インターネット上に存在するWebページを巡回し、情報を収集して行きます。(クローリング)

主に、ネット上に存在するリンクを辿って巡回し、
URL、コンテンツ、メタ情報などを収集して行きます。

2.収集した情報をインデックスする

クローラーが収集した情報を基に、検索エンジンが判断してデータベースに登録されます。(=インデックス)

インデックスされるかどうかは、
検索エンジンがコンテンツの質を評価して判断して行きます。
つまり、ページを作成したからといって必ずインデックスされるわけではなく、
検索エンジンに一定の評価を得たページがインデックスされます。

3.検索結果に表示される

ユーザーが検索すると、検索エンジンは「インデックスされたページの中から」、検索クエリと関連性の高いページを検索結果に表示します。

検索結果の順付け等は、検索エンジンに組み込まれている「アルゴリズム」(計算式)によって行われます。

検索エンジンのアルゴリズムの詳細内容は非公表ですので、わかりませんが、
Googleが提供しているドキュメントや品質ガイドラインを読むことにより、概要を知ることができます。

検索エンジンの仕組み/流れ

  • インデックスとは、検索エンジンの「データベースに保存」されること
  • インデックスされないページは、「検索結果に表示されない」

インデックスされないことの弊害

検索エンジンにインデックスされる(データ保存される)ことで、
検索結果に表示される可能性が生まれることを見てきました。

つまり、インデックスされなければ、検索結果に反映されることはない、ということのなのですが、問題はそれだけではありません。

インデックスされないことの弊害について確認して行きましょう。

サイト全体の評価が下がる

検索エンジンにインデックスされないページが多いと
サイト全体の評価が下がり、
サイトのあらゆるページの検索順位が上がらない・下がる可能性があります。

検索エンジンは、インデックスされたページの質を評価して、サイト全体の評価を判断します。
そのため、インデックスされていないページが多いと、サイトの質が低いと判断され、サイト内のあらゆるページにマイナスの影響が出る可能性があるのです。

2022年に導入された「ヘルプフルコンテンツアップデート
(日本では2023年1月から導入)では
AIによってコンテンツ評価がなされるようになり、
価値が低いと判断されたページは、
インデックスされずに、検索結果に反映されないだけではなく、
こうしたページが多いと、サイト全体の「評価を下げる」という仕組みが導入されました。

「ユーザー満足度が低い」ページを作成することは、
そのページが検索結果に反映されないだけではなく、
サイトの評価を下げてしまい、SEOにマイナスとなる、ということなのです。

2024年3月に、Googleは新しいスパムポリシーを発表し、「大量生成されたコンテンツの不正使用」をスパムとしました。
つまり、質の低いコンテンツページを大量生産する行為はスパムであり、サイトの評価が下がり、検索順位下落やインデックスされない(検索圏外)になる可能性があります。

リンクの効果が下がる(nofollowリンク化)

これまで、ページを大量に作成して、特定のページにリンクを集中させせることで、検索順位を引き上げようとするSEO手法がありました。

現在、その手法は通用するのでしょうか?

答えは「NO」です。

検索エンジンにインデックスされていないページは、データ保存されませんので
そのページに付けられたリンクはnofollow扱いになります。
(Google検索エンジンの場合)

つまり、粗製乱造でページ量産⇒大量のリンク・・・という方法ではSEO効果が上がらないのです。

nofollowのリンクは、検索エンジンに「フォロー(追跡)する必要がない」という言意味ですので、被リンクとしての効果がきちんと発動されません。

ユーザー満足度の高いコンテンツページを作って、検索エンジンにインデックスされてはじめて、そのページからのリンクが有効に評価されるのです。

ページがインデックスされているか、確認しましょう

インデックスがSEOにおいて極めて重要であることを確認してきましたが、
実際に自社サイトのページがインデックスされているか、気になると思います。

インデックスされているかどうかの確認方法を見て行きましょう。

「site: 検索」で確認する

「site: 検索」(siteコマンド検索)とは、ウェブサイトのページが検索エンジンにインデックスされているかを確認する検索方法です。

Google検索の検索窓に、
site:URL を入れることで、サイト内のどのページがインデックスされているかを確認できます。

たとえば、↓のように検索します。

site: 検索

site: の後ろに、URLを入れて検索するだけです。

「site: 検索」は、サイト内にインデックスされているページが表示されます。
他社のサイトについても、同様の方法で調べることができます。
ただし、検索結果が必ずしも最新の状態ではない場合があり、
検索エンジンのアルゴリズムの変更によって、結果が変動することもあります。

「サーチコンソール」でページ毎に確認する

Googleが提供する無料ツール「サーチコンソール」で、
ページ毎にインデックスされているかを調べることができます。

「サーチコンソール」を開いて、一番上の検索窓に、調べたいページのURLを入れてチェックしてください。

「サーチコンソール」でページのインデクス確認

URL は Google に登録されています
「ページはインデックスに登録済みです」
と表示されればOKです。

「サーチコンソール」で「ページはインデックスに登録済みです」と表示

URL が Google に登録されていません」と表示されたら、
インデックスされていない、ということです。

「サーチコンソール」でサイト内ページを確認する

サーチコンソール」で、サイト内のどのページがインデックスされていないかを確認することもできます。

サーチコンソールの左にある「ページ」をクリックして、
「検出 - インデックス未登録」と「クロール済み - インデックス未登録」を確認しましょう。

「サーチコンソール」で「インデックス未登録」を確認する

「検出 - インデックス未登録」は、検索エンジンがクローリング(巡回)していない(=ページを見つけていない)状態です。

「クロール済み - インデックス未登録」は、検索エンジンがクロールしたうえで、「インデックスしない」と判断したページとなります。

この2つをそれぞれクリックすると、データページが開きます。

「サーチコンソール」で「インデックス未登録」ページのデータを確認する

赤い印のところ↑をクリックしますと、対象のページがブラウザの別タブで開きますので、どのページがインデックスされていないか、確認してください。

検出 - インデックス未登録」のページは、↓の赤のところをクリックして、

「サーチコンソール」で「インデックス未登録」ページの「URL検査」を行う

「インデックス登録をリクエスト」をクリックします。

「サーチコンソール」でインデックス登録をリクエスト

クロール済み - インデックス未登録」は、検索エンジンがクロールしたうえで、「インデックスしない」と判断したページですので、
ページのコンテンツなどの改善が必要になります。

以下の改善対策を確認して、対策を行ってください。

ページをインデックスさせるための改善対策

作成したページが、検索エンジンにインデックスされることは、SEO上、とても重要です。

では、インデックスは、ページのコンテンツの質を中心に検索エンジンが判断しますので、
以下の内容でページ・サイト・リンクを改善して、効果的にインデックスされるWEBページ・サイトにして行きましょう。

質の高いコンテンツを作成する

検索エンジンは、作成されたページの「コンテンツの質」を評価して、インデックスするか・しないかを決めています。
ですので、「質の高いコンテンツ」を作成することが最も重要なことになります。

以下の内容をチェックしながら、コンテンツ制作を行ってください。

  • ユーザーの疑問やニーズに答える
    ユーザーの検索意図を考え、必要とされている内容を書いて行きましょう。
  • 独自性・専門性が高い
    他サイトのコンテンツの「コピペ」や「真似して手直ししただけ」といったものは、まず検索エンジンに評価されず、インデックスされません。
    「他にはない情報」「独自性の高い情報」を目指しましょう。
  • わかりやすい・よみやすい
    ページ構成がわかりやすく、ユーザーにとって読みやすいページに仕上げましょう。
    画像・図・表などを適宜使うのも有効です。
  • 誤字脱字がないこと
    おかしな日本語表現や、誤字脱字がないことが大切です。

メタタグ情報を正確に入れる

ページ内容を検索エンジンが理解しやすくするためにメタタグを正確に設定しましょう。

  • タイトルタグ(ページの表題・タイトルを設定)
    ページ毎に必ず違うものを設定。重要なキーワードは前に置く。
    35文字以内。キーワードの繰り返しは避ける。
    サイト何に重複したタイトルタグのページがある場合は、タイトルを設定を分けて行く。(検索エンジンは、同じタイトルタグの記事を、複数インデックスことはありません)
  • ディスクリプションタグ(そのページの要約文)
    ページ毎に必ず違うものを設定。ページの要約文として魅力的な内容にする。
    100~130字程度がよい。キーワードを適切に入れる。(重要ワードは2~3回入れる)

上記2つのタグは特に重要ですので、
キーワードを入れながら、検索意図を考えて設定してください。

  • hタグ(見出しタグ)
    ページコンテンツに見出し(h2~h4タグ)を設定して、読みやすくする。
    hタグもキーワードを意識する。(過剰なキーワード埋め込みは避ける)
  • alt属性(画像の説明文)
    画像の説明を簡潔に書く。その画像の説明文であり、関係ない内容は入れない。

hタグ、alt属性も、SEO対策上重要ですのでしっかり施ってして行きましょう。
インデックスを促す効果があります。

内部リンク設定を行う

検索エンジンは、リンクを辿って巡回しますので、
クローリングを促進するには「内部リンク」が有効です。

関連ページからリンクを貼ることで、ユーザーの利便性の向上につながると同時に、
サイト内のリンクを密にすることで、SEO効果が高まり、
リンクが集中しているページはインデックスされやすくなります。

内部リンクとは、Webサイト内のページ同士を結びつけるリンクのことです。
内部リンクを適切に設定することで、インデックスの促進につながります。

  • 関連性の高いページに内部リンク
    検索エンジンは、内容的に関連性が高いページにリンクされていることを評価します。
    そのため、サイト内の関連性が高いページからリンクを貼ることで、インデックスを促進することができます。
    関連性が高いとは、「同じテーマ」「関連するワードを含む」などのページです。
  • 定期的な内部リンクの更新
    新しいページを作成したときや、コンテンツを更新・書き換えしたりしたときには、内部リンクも合わせて変更・更新するようにしましょう。
    内部リンクが最新の状態になっていることで、インデックスが促進されます。

ページの表示速度を改善する

ページの表示速度が極端に遅いページは、検索エンジンから評価されず、インデックスされない可能性があります。

グーグルが提供している「PageSpeed Insights」を使って、ページの表示速度を確認し、
示された改善ポイントを参考に、表示速度を速めるようにしましょう。

HTTPSでユーザーの安全を守る

ウェブサイトがSSL対応(HTTPS化)されていない場合、ページのインデックスが見送られることがあります。

SSL対応(HTTPS化)とは、通信の暗号化のことで、サイトのサーバーとユーザーのブラウザの間の通信を暗号化して、悪意ある第三者への情報漏洩などを防ぎ、安全にページを閲覧してもらう機能です。

SSL対応は、ホームページに必須となっていますので、必ず導入してください。

重複コンテンツがないかチェックして対策する

サイト内に似たようなコンテンツページが複数ある場合(重複コンテンツ)は、検索エンジンはインデックスしません。

サイト内に内容が重複するページがないかチェックしましょう。

重複コンテンツがある場合は、以下の対策(いずれか)を行って行きます。

  • ページを1つにまとめ、不要なページを削除する
    似たような内容のページが多いと、サイト全体の評価が下がってしまう可能性がありますので、不要なページを削除し、1つのページを充実させる形でリニューアルします。
  • canonicalタグで正規化する
    canonicalタグ(カノニカルタグ)とは、検索エンジンに「このページが正規ページ」と伝えるタグで、重複コンテンツが複数ある場合に設定することで、評価を1本化することができます。
  • リダイレクトでページを集約する
    リダイレクトは、不要となったページを開こうとしたときに、集約したいページが表示されるようにする設定です。
    集約先のページを将来書き換える可能性がある場合は、canonicalタグよりもリダイレクト設定を行うことをお勧めします。

サイトマップを作成してGoogle登録する

「サイトマップ」といいますと、サイト内に表示される(ユーザーが見ることができる)HTMLサイトマップを思い浮かべることが多いかもしれませんが、
これとは別に、ユーザーには見ることができない・検索エンジンにページの存在を伝えることを目的とした「XMLサイトマップというものがあります。

XMLサイトマップを作成して、サーチコンソール登録することで、
検索エンジンに、サイト内のページを正確に、短時間で伝えることができるようになり、
インデックスを早めて、促進する効果があります。


Googleサーチコンソールのサイトマップ登録方法↓
サーチコンソール・サイトマップ登録

再度、インデックスをリクエストする

先にご説明した「サーチコンソール」でのインデックス調査で「URL が Google に登録されていません」と表示されたときは、
そのページはインデックスされていません。

「インデックスのための改善対策」を一通りチェックして、改善した後に、
検索エンジンに再度、インデックスを依頼しましょう。

Googleサーチコンソールでインデックスリクエストを行います。

「サーチコンソール」を開いて、一番上の検索窓に、調べたいページのURLを入れてチェックしてください。

「サーチコンソール」でページのインデクス確認

「URL が Google に登録されていません」と表示されたら、
URL検査の「インデックス登録をリクエスト」をクリックします。

「サーチコンソール」でインデックス登録をリクエスト

お疲れさまでした。
あとは検索エンジンが再度判断してくれるのを待ちましょう。

《まとめ》

  • インデックスとは、webページの情報が検索エンジンにデータ保存されること。
    インデックスされることで、検索結果に表示される可能性が生じます。
  • ページが「インデックスされない」第一の理由は、コンテンツの質が低く、データ保存の価値がない、と判断されてしまっていることにあります。
  • インデックスされていないページがサイト内にたくさんあると、サイト全体の評価が下がり、他のページの検索順位にもマイナスの影響をもたらします。
  • 「質の低い」ユーザー満足度の低いページを量産することは、SEOに大きなマイナスとなる時代に入っていますので、
    1ページ1ページ、丁寧に作るり込むようにして行きましょう。
  • 「ユーザーが求めている内容は何か?」を常に考えながらウェブページを増やして行くことで、サイトの評価が高まり、SEOに強いホームページとなって行きます。

著者:SEOコンサルタント・ウェブデザイナー
SEOホームページ代表 占部圭吾

sen-2.png

《関連ページ》