SEO・WEB用語
重複コンテンツ
SEO・WEB用語
重複コンテンツ
重複コンテンツとは、
同じウェブサイト内に、同じような内容のページが重複して存在していることを指します。
つまり、似たような内容・同じような情報が、サイト内に複数存在していることです。
「サイト内のページは多いほど良い」「更新頻度が高いほど良い」という側面だけを考えて
とにかくページーを増やす…という方針でSEO対策を行っていると
重複コンテンツページが増えてしまうことになります。
このページでは、
「重複ページの何が問題となるのか?」「どのように対策を行えばいいのか?」
などについて、わかりやすく解説いたします。
「重複コンテンツ」と似た言葉に、「コピーコンテンツ」があります。
この2つは、混同して使われることが多く、
実際には、「コピーコンテンツでもあり、重複コンテンツでもある」ということもありますので、わかりずらく、
問題を整理しずらい原因となっています。
そこで、このページでは、この2つを整理して分けてご説明したいと思います。
重複コンテンツ | コピーコンテンツ | |
範囲 | 自サイト内 | 他サイト |
---|---|---|
原因 | ページ量産(誤ったSEO対策) | 無断コピー |
上の表の通り、「コピーコンテンツ」は、多くの場合は、
意図的に他サイトのコンテンツを「コピー」して表示したページをいいます。
(コピーして、少しだけ手を加えた場合も含みます)
一方、「重複コンテンツ」は、自社サイト内で、
同じような情報が複数存在してしまっている状態を指します。
「コピーコンテンツ」は、意図して行う作為的なケースが多いですが、
「重複コンテンツ」は、知らず知らずの間に、そのような状態になってしまっているケースが多い、ということができます。
「重複コンテンツ」は、なぜ問題になるのでしょうか?
まずは、ユーザーにとって、同じ内容のページが複数あることは、意味がなく
ユーザーがどのサイトの中の情報を探して行く際に混乱を招く可能性が高いからです。
一つのページでしっかり情報整理して、読んで満足度の高いページには価値がありますが、
同じような内容のページが、そこかしこに散乱しているサイトは、ユーザビリティーが低くなるということです。
重複コンテンツ自体は、Googleのスパムポリシー違反にはなりませんが、
検索エンジンのクロール リソース(資源)を浪費させてしまう可能性があり、サイト内のページを把握するのを妨げてしまうかもしれません。
「ヘルプフルコンテンツシステム」という新しい検索エンジンのコンテンツ評価の仕組みが導入され(「ヘルプフルコンテンツアップデート」2023年1月~)、
2024年3月にコアアルゴリズムとしてすべての検索ランキング表示に大きな影響を与えるようになっています。
「ヘルプフルコンテンツシステム」は、
コンテンツが「ヘルプフル」=「ユーザー満足度が高い」「有益で役立つ」ものであるかどうかをAIを通じて判定し、それが検索順位決定の重要な要素となる仕組みです。
その特徴は、
ことにあります。
AIが機会学習を通じて、大量のコンテンツ評価を行うことが可能になり、
粗製乱造された低品質なコンテンツのページが多いサイトは評価が下がることになります。
(低評価されたサイトでは、各ページが上位化しずらくなります)
重複コンテンツの場合、各ページが「人のために作り込まれたページ」であれば低評価にはなりにくいと考えられますが、
重複コンテンツが多く&それが低品質である場合は、サイトの評価が下がり、SEOにマイナスの言影響を受ける可能性が高くなる、ということです。
実際には、重複コンテンツがあっても、
検索エンジンが、一つのページを正規ページとみなして評価するように試みますので、
過剰に気にしすぎる必要はありません。
ただし、検索エンジンのサイト評価は、コンテンツを中心に行われますので
「ユーザー満足度の高いコンテンツ」を丁寧に1ページ1ページ制作を進める必要がある、ということを認識してサイトを構成して行く必要があります。(粗製乱造された・低品質な重複ページが大量にある場合は、ページ削除を検討した方がよい場合もあります)
SEO対策を進める上で、あなたはこう考えていませんか?
もちろん、これらは正解と言えますし、検索順位を上げる可能性を高めます。
ですが、品質が低い(ユーザーにとって満足度が低い)ページをたくさん作ればよいという時代ではなく、一つ一つのページの品質が問われ、粗製乱造された重複ページが多いサイトはSEOにマイナスとなってしまいます。
いくら「ページ数を増やすため」「更新頻度を上げるため」といっても、質の低い重複コンテンツを増やしても意味はなく、
逆に検索エンジンの評価を下げる結果につながりやすい、ということです。
コンテンツの品質を上げるためには、以下を考えて制作することが大切です。
粗製乱造でページ数だけが多いサイトよりも、
1ページ1ページ、丁寧に、
ユーザーのことを考えて作成されたページが大切ということであり、
重複コンテンツのページをたくさん作るより、SEO効果を上げるためには、
検索クエリ(検索内容)ごとに、それに応える内容のコンテンツページを丁寧に作成していった方がよい、ということになります。
重複ページについてGoogleは、
「検索セントラル」の「SEOスターターガイド」の『Google が重要でないと考えること』というセクションで以下のように説明しています。
「Google が重要でないと考えること」~重複コンテンツは「ペナルティ」になる
複数の URL からアクセスできるコンテンツがあっても問題はなく、気にする必要はありません。非効率ですが、手動による対策が必要になることはありません。
つまり、多少の重複コンテンツページの存在を、過剰に気にすることは「ありません」と言っています。
基本的に、検索エンジンが重複コンテンツの中のいずれかのページを正規ページと認定して、それに対して評価を行って行きますので、
「重複ページはすべて削除するなり、何ならかの対応をすぐにしなければ」
…と考える必要はないということです。
ただし、以下の点は考慮すべきです
これらを考えた上で、必要に応じて、対策を行うようにしましょう。
では、上記をふまえた上での対策方法をご案内します。
重複コンテンツについての現状把握は、
サーチコンソール(Google Search Console)で行います。
(WB運営者は、サーチコンソール登録は必須と言えます)
重複コンテンツなどでによって、Googleから手動による対策として「ペナルティー」を受けている場合、早急な対応・対策が櫃表になります。
サーチコンソール(Google Search Console)を開いて、
左メニューにある「手動による対策」で確認しましょう。
「手動による対策」ページに、重複コンテンツに関するペナルティー情報が表示されます。
「問題は検出されませんでいた」と表示されればOK。
「重複しているページ」としてページが表示されたら、そのページがペナルティーを受けている可能性が高いですので、早急に対策する必要があります。
上記のいづれかの方法で対処しましょう。
どの方法にするかはケースにもよりますので、後述します。
重複コンテンツペナルティーを受けている場合、すべての重複コンテンツを修正する必要があります。
上記の対策を行っても、ペナルティー解除に数か月以上の時間がかかる場合があります。
「手動による対策」で問題が検出されていなくても、ペナルティーを受けていることはありますので、注意が必要です。
インデックスとは、検索エンジンが、検索結果に表示するために、
ページの情報をデータ化して保管することです。
「重複コンテンツ」と検索エンジンに判断された場合は
「インデックスされません」ので、
サーチコンソールで、インデックスされていないページを確認し、
検索エンジンにサイトの各ページがどのように評価されているか確認して行きましょう。
サーチコンソールの左メニューにある「ページ」をクリックして
「ページがインデックスに登録されなかった理由」のところを見てください。
一番下の「クロール済み - インデックス未登録」は、検索エンジンがページを巡回したうえで、「データ化の価値がない」と判断したページですので、
ここに重複コンテンツページがある可能性が高いです。
(または、単にコンテンツの質が低い)
「クロール済み - インデックス未登録」をクリックしますとページが開き、
インデックスされなかったページのURLが表示されますので、
1ページ1ページ確認にして行って、原因を考えて対策方法を考えましょう。
「検出 - インデックス未登録」のところは、検索エンジンがページ存在は確認したが、ページ巡回できなかったページです。(サイト構造が複雑で、検索エンジンがクローリンクできない、など)
重複コンテンツ対策は、サーチコンソールで現状把握を行い、サイト全体がどのよう状態かを確認して、
それぞれのページについて、どの様に対策するか個別に決めて行きましょう。
(それほど重複婚点が多くなければ、対策不要、という判断も「あり」です。
ただ、検索上位化を意図して作り込んだページがインデックスされていなかったり、
インデックスされていても、古い・質の低いページの方が検索結果に出て入りたりした場合は、対策が必要かもしれません。
サイト全体の各ページを、「リスト化」「一覧表化」するなどして洗い出し、
それぞれのページの現状を把握してから、個別に判断して対策をするようにしましょう。
重複コンテンツの対策は
ページ毎に方針を立てて行うことが大切です。(サイト全体も見ながら)
では、具体的な対策方法を見て行きましょう。
重複コンテンツページの対策の中で、最もシンプルで簡単なのが
ページの「削除」です。
コンテンツ内容があまりに古い・間違った内容が書かれている…などで活用できない場合に、この方法を検討します。
注意点は、
削除は、ページを永久に消滅させることですので、慎重に判断してください。
重複コンテンツ「ページの削除」
【メリット】
【デメリット】
301リダイレクトとは、あるページにアクセスしようとしたときに、リダイレクト先のページに転送される設定です。
ユーザーも、リダイレクト元のページを見ることができず、
(リダイレクト先が表示)
検索エンジンは、リダイレクト先を正規のページとみなします。
重複コンテンツページをリダイレクトすることによって、
301リダイレクトは、サーバーの「.htaccess」というファイルで設定を行います。
重複コンテンツ「301リダイレクト」
【メリット】
【デメリット】
重複コンテンツの各ページを、1つのページに正規化する方法に「canonicalタグの設定」があります。
これは、検索エンジンに「このページの正規ページ」を伝えることで、検索エンジン評価を集約する目的で設定を行うものです。
301リダイレクトでは、ユーザーにはリダイレクト元のページは表示されませんが、
canonicalタグの場合は、設定元のページをユーザーが見ることができます。
「ユーザーにはページ内容を見せたい」
「検索エンジンの評価は受けずに、他ページに評価を集中させたい」
という場合に設定します。
ただし、canonicalタグで正規ページとしたページのコンテンツを大幅に変える場合は、その''ページのURLを変えて、canonicalタグを再設定する必要があります。
(ページコンテンツを小規模にリライトする場合は、上記は不要)
コンテンツを根本的にリライトする可能性がある場合は、
canonicalタグは注意が必要となります。
重複コンテンツ「canonicalタグ」
【メリット】
【デメリット】
重複コンテンツの対策の中で、最もお勧めしたいのは、
コンテンツのリライトです。
コンテンツのリライトとは、ページ内の文章を書き換えて、よりユーザーの満足度が高いものに仕上げ直すということです。
重複コンテンツの場合は、ただ書き直すのではなく、
「テーマを分ける」「タイトルタグを鮮明にする」ことが必要となります。
例えば、
「検索エンジンとSEO」に関する重複コンテンツのページが複数ある場合、
タイトルタグやテーマを
●検索エンジンの仕組みとSEO
●検索エンジンのインデックスとSEO
●検索エンジンのAI活用で変わるSEO
…など、明確に、掘り下げる内容を分けてコンテンツを作ることです。
このように重複コンテンツをリライトすることで、
ユーザーニーズに合致したページとなり、
複数の検索ワードで上位化の可能性が高まる「ロングテールSEO」を行うことができます。
また、リライトする際に一番重要になることは
そのキーワードで検索した人が
「読んでよかった」「解決した」「疑問が解けた」「変わりやすかった」と感じ、高い満足度を得るような内容になっているかです。
「ユーザー満足度」に焦点を当ててリライトするようにして行きましょう。
「ページ削除」では、内部リンク再設定等の関連対策が必要ですし、
「301リダイレクト」「canonicalタグの設定」は、サーバー内での設定が必要になり、専門知識が必要になりますが、
コンテンツのリライトは、文章を変えて行くことがメインですので、時間さえあれば行うことができ、サイト内のコンテンツ品質を高めて、SEOにも大きなプラス効果があります。
重複コンテンツ「リライト」
【メリット】
【デメリット】
重複コンテンツの対処・対策方法として、もっともSEO効果が上がるのは、
コンテンツの「リライト」です。
リライティングは、少し書き直せば効果が上がるというわけではありませんので、
計画を立てて、効率的に行いましょう。
SEO効果が上がる重複コンテンツのリライト方法をご案内しますので、ぜひ、参考にしていただき、取り組んでみてください!
重複コンテンツのリライトの流れは、以下のようになります。
1.
重複コンテンツの現状把握
サイト内で、インデックスされていないページをサーチコンソルで調べる
2.
ページ毎に「テーマ分け」を行う
テーマ・タイトルタグなどを分けることで重複でなくなります
3.
ユーザー満足度の高いコンテンツ作成
ユーザーが求めている内容は何かを考えて、わかりやすいコンテンツにする
4.
インデックスをリクエスト
リライトが終わったら、サーチコンソールで、検索エンジンに再評価を求めます
「どのページが重複コンテンツか?」
「検索エンジンにインデックスされてないページはどれか?」を
先ほど紹介したサーチコンソールの「ページ」欄で確認します。
「クロール済み - インデックス未登録」となっているURLを確認して行きます。
重複コンテンツページ・インデックスされていないページの「一覧表」をつくり、
実際にそのページを確認して、どのページから、どのようにリライトして行くかの大枠の方針を立てましょう。
複数の重複しているページを対策するには、
各ページに明確なテーマを設定することが大切です。
ページがそれぞれ、
「独立した目的を持ち」、
「別のニーズを持ったユーザーに向けて書かれている」
ことで、各ページが独自の存在意義を持ちます。
「テーマ」と「ユーザー層」を考えて、ページ分け方針を立てましょう。
たとえば「サーバーの仕組みと選び方」というページと
「サーバーとSEOの関係」というページでは
ユーザーがほしい内容も、ユーザーがどのような知識を持った人なのかも、大きく違いますので、別々のコンテンツページとして検索エンジンが評価し、SEO効果を持ちえます。
また、以下のような重複コンテンツがある場合は
たとえば、以下のようにページを統合します。
【ページA】
【ページB】
【ページC】
【ページD】
【新ページA】
【新ページD】
上記は、あくまでも例ですので、
コンテンツの内容や、ユーザーが知りたいことは何かを考えながら行ってください。
上記の例の場合は、ページB、ページCから、新ページAにcanonicalタグを設定します。
SEO効果の高いコンテンツを作成するために最も重な視点は
ユーザー満足度の高いコンテンツを作成することです。
以下の点を考えながら、コンテンツを作成しましょう。
「ページ毎に独立した内容になっていること」
「ユーザー満足度を上げるように工夫すること」で
重複コンテンツが解消されるだけでなく、それぞれのページがSEO的に評価され、サイト全体の評価も高まります。
ページのリライトが終了したら、そのままでOKではなく、
検索エンジンに再評価してもらうようリクエストします。
「サーチコンソール」を開いて、一番上の検索窓に、リライトしたページのURLを入れてエンターキーをークリックします。
「インデックス登録をリクエスト」をクリックします。
これでOKです。
検索エンジンが巡回しくれるまで少し待ち、そのページがインデックスされているか再確認しましょう。
また、新しいページを作ったら、内部リンクを見直して、そのページへのリンクをしっかり設定してください。
検索エンジンはAI時代に入り、サイトがどのような品質のコンテンツをそろえているかが、サイトの評価となり、SEOに大きな影響を与えるようになっています。
低品質なコンテンツページを量産するのは止め、
コンテンツを1ページ1ページ丁寧に作り込むことで、サイト全体の評価が高まり、
より集客力の高い・SEOに強いサイトに成長して行きます。
著者:SEOコンサルタント・ウェブデザイナー
SEOホームページ代表 占部圭吾
《関連ページ》
SEOホームページでは、
SEOに強い・WEB集客を実現するホームページ制作を行っております。
「月額無料」「追加料金なし」
ホームページ運営法・集客・SEOなどのアドバイスも行います。
検索で上位表示することができるホームページ制作で、
ビジネスを拡大してください!