重複コンテンツとは文字通り、内容の重複がみられるコンテンツのこと。重複コンテンツはSEOの観点上、好ましくないと考えられています。
しかし、そうは言っても「重複コンテンツがなぜ好ましくないのか」を知らなければ、どう改善すれば良いのか、次のアクションには移せません。そこで本記事では、重複コンテンツが好ましくない理由、重複ページの調べ方、対策方法を徹底解説します。
本記事をお読みいただくことで、重複コンテンツに対する適切な処置がわかり、効果的なSEO対策を立てられるようになるでしょう。SEO施策を担当している方、重複コンテンツについてお悩みの方は、ぜひ最後までお読みください。
重複コンテンツは異なるページURLで内容が類似している、あるいは被っているコンテンツを意味します。自サイト内部に限らず、外部サイトのコンテンツと重複してしまうケースもあります
また、自サイト内部での重複は検索結果に表示されにくくなる、被リンク評価が分散するなどのリスクが大きいです。Google検索での表示順位が下がり、SEO効果が弱くなってしまうケースもあります。
ペナルティ対象とまではなりませんが、SEO効果を高めるには、重複コンテンツは少ないのが理想です。一方、外部サイトのページコンテンツとの重複は、場合によってはペナルティの対象となります。
Googleでは外部サイトのコンテンツのコピーを明確に禁止しているため、自サイト内でも同じようなコンテンツを意図的かつ悪質に公開している場合は、ペナルティ対象となり得ます。
重複コンテンツとみなされる可能性のあるパターンとして、以下の3点があげられます。
単語や文章の順番が違っても、内容自体は同じであれば、重複コンテンツとみなされる可能性が高いです。なお自サイト内では、定型文の使用や似たテーマでのコンテンツ作成などにより、どうしても内容の重複が発生しがちです。またサイトの構造によっては、別のコンテンツで扱った内容でも記載したほうが良いケースもあります。
このような理由から自サイト内での重複コンテンツは、多くの場合ペナルティの対象とはなりません。もし自サイトのコンテンツ同士で重複がみられても、必ずしも修正する必要があるとは限らないのです。
重複コンテンツがサイト内にあると、SEO評価にどのような影響があるのかについては大きく分けて、以下の3点があります。
それぞれ詳しく解説します。
Googleは、類似したページを検索結果に表示させないという性質があります。すなわち重複コンテンツとみなされてしまうと、検索結果に表示されない恐れが大きいのです。Googleは検索結果を最適化したうえで表示させているため、ユーザーが混乱しないように類似したコンテンツは表示させない傾向が強いです。
Googleのクローラーは、さまざまなテーマ・内容のページをバランスよくインデックスしようとします。そして似たようなページはインデックスの必要がないと判断され、検索エンジンに登録されない可能性があるのです。結果として、せっかく作成し発信している記事コンテンツが、検索エンジンに表示されないという事態が起こり得ます。
受けられる被リンク評価が分散してしまうのも、重複コンテンツがSEO上よくないとみなされる理由のひとつです。
本来100の評価を受けられるはずのページについて、内容が重複しているコンテンツが存在すると仮定します。このような場合、100の評価が50と50などに分散してしまい、得られる評価が下がります。すなわち重複コンテンツの存在により、正しい評価が受けられなくなってしまうのです。
Google側が自動で処理をし、評価が分散せずに済む可能性もあります。しかし必ずしも正しい処理が行われるとは限りません。評価の分散は、得られるはずだった評価の取りこぼしともいえます。重複コンテンツの存在は、SEO効果を必要以上に低くする恐れが大きいです。
重複コンテンツが悪質なコピーコンテンツとみなされると、ペナルティの対象となります。ペナルティを課された場合、検索順位が大幅に下がる、インデックスが削除され検索結果に表示されなくなるといった事態が起こり得ます。こうなると検索結果からの流入が期待できなくなってしまうでしょう。
悪質とみなされるケースとして以下の例があげられます。
また自サイト内部でも、ページ数を増やすために同じ内容のコンテンツを複数設置すると、悪質とみなされる恐れがあります。繰り返しになりますが、コピーコンテンツの掲載は、Googleのガイドラインで明確に禁止されている行為です。
重複コンテンツを調べる方法として、以下の2種類があります。
それぞれの方法について詳しく解説します。
自サイト内での重複コンテンツを調べるなら、Googleが提供しているSearch Consoleが便利です。ペナルティの確認は、以下の手順で行います。
遷移後のページで「問題が検出されませんでした」と表示されていれば、ペナルティを受けているページはありません。
重複コンテンツは専用のチェックツールを使って調べる方法もあります。チェックツールを活用すれば、重複コンテンツの恐れがあるページが存在しないか、何を改善するべきかなどが分析しやすくなります。今回紹介するチェックツールは以下の3つです。
それぞれのツールについて詳しく解説します。
sujiko.jpは、類似判定したい2つのページを比較し、類似度を分析できるツールです。
費用 | 無料 |
会員登録 | 不要 |
ツールの使い方 |
|
利用できる回数 | 1日5回まで |
ポイント・注意点 |
|
sujiko.jpは、特定のページが「重複しているとみなされないか不安」といった場合に適したツールです。そのため、重複コンテンツが存在するか明確でない場合は、別のツールを活用するのが良いでしょう。
CopyContentDetectorは、入力したテキストがWeb上に存在するコンテンツの内容と重複していないかチェックできるツールです。コピペチェックツールとして多く使われています。
費用 | 無料でも利用可能 有料プランは月1,000円もしくは6,000円(税込) |
会員登録 | 会員登録しなくても利用可能 |
ツールの使い方 |
|
利用できる回数(無料の場合) |
|
ポイント・注意点 |
|
公開前のコンテンツについて、他社サイトとの重複の恐れがないかを確認する際に役立ちます。
こぴらんは、入力したテキストがコピーコンテンツに該当しないかをチェックできるツールです。シンプルな仕様のため、簡易的なチェックに役立ちます。
費用 | 無料 |
会員登録 | 不要 |
ツールの使い方 |
|
利用できる回数 | 制限なし 1回の文字数は上限4000字 |
ポイント・注意点 |
|
簡易的なツールですが、重複コンテンツを調べるには十分といえます。手軽にチェックしたい場合などに使うと良いでしょう。
重複コンテンツが見つかった場合は、可能な限り対策するのが理想です。しかし一言で対策といっても、重複コンテンツの状況によって効果的な方法が異なります。そのため状況に合わせた対策が必要です。今回紹介するのは以下6パターンです。
それぞれのパターンについて、対策方法を詳しく解説します。
重複コンテンツに多いのが、URLの表記に一貫性が保たれていないパターンです。運営側としては同じページとして扱っているものの、URL表記が複数あると、同じ内容のページが重複しているとみなされてしまいます。URLが統一されていない例として、以下のようなケースがあげられます。
このような場合には、どれかひとつを正規化して明示する対応が必要です。対処法として、以下2種類の方法があげられます。
どちらの方法が良いかはサイトの状況や目的によって異なります。そのため自社サイトに合わせた対策が必要です。それぞれの方法について詳しく解説します。
ユーザーがアクセスするURLが1つのみでよいなら、301リダイレクトが効果的です。301リダイレクトとはページに訪問したユーザーを、設定した別のURLへ自動で遷移させる処理です。
たとえば先頭に「www」がついているページを正規URLとする場合、「www」がついていないページに301リダイレクトを設定します。すると「www」のついていないページに訪問したユーザーは、自動的に「www」のついたページ、すなわちコンテンツが掲載された正規コンテンツへ移動するのです。
301リダイレクトを設定すれば、正規URL以外のページにはコンテンツを掲載させる必要がなくなります。したがって重複コンテンツの存在を防げるのです。
同じコンテンツを別々のURLのまま運用したい場合には、canonicalを実施しましょう。canonicalとは検索エンジンに正規URLを伝えるために記述するタグです。canonicalを設定することで、似た内容のページが複数存在する中から、正規URLとして扱うべきページを判断できます。
ただしcanonicalは命令ではなく、あくまでクローラーに対するヒント・案内という役割です。そのためページのアクセス数が多いなど、ケースによってはcanonicalを記載したページ以外を正規URLとして判断する可能性もあります。正規URLとしたいページ以外には、命令の性質を持つnoindexタグ(検索エンジンへの登録を防ぐ)を利用するのが確実です。
動的URLによって重複コンテンツが生成されてしまうパターンも存在します。こちらは多くの場合、システムの仕様によるものです。
たとえば遷移元のページによって、同じ内容のページなのに遷移先のURLが変わってしまう事態が起こり得ます。ECサイトで色違いの賞品を見せるときに、パラメーターだけ変わってしまうケースもあります。このような場合も重複コンテンツとみなされてしまうため、早めに対処できるのが理想です。
動的URLが原因の場合は、canonicalによる正規URLの設定、もしくはSearch Consoleでのパラメータ設定が適切です。Search Consoleでのパラメータ設定については、次の章で詳しく解説します。
Search ConsoleにはURLパラメータツールが存在します。パラメータツールでは、以下のような設定が可能です。
パラメータを設定すれば、重複コンテンツによるSEO効果の低減リスクをおさえられるのです。パラメータ設定は以下の手順で行います。
ただしパラメータの作用が不明の場合には、誤った設定のリスクを防ぐため、設定の変更を避けたほうが無難です。
PC用・スマホ用にそれぞれ別のURLを設けているパターンも、重複コンテンツとみなされる可能性が高いです。この場合は主に2種類の対策があげられます。
閲覧するメディアを問わないレスポンシブWebデザインを活用すれば、URLを分けずに済みます。しかしこの方法はデザインを大きく変える必要があり、手間・コストが大きいです。またサイトによっては実施できないケースもあります。
したがってPC用・スマホ用に別のURLを設けている場合は、アノテーションの設定が便利です。アノテーションとはデバイスごとに異なるURLを提供しているという事実を、検索エンジンに伝えるための処理です。アノテーションは以下の流れで設定します。
アノテーションにより、重複コンテンツとしてみなされてしまうリスクをおさえられます。
続いて紹介するのは、他サイトにコンテンツを提供しているパターンです。ニュースサイトなどに、自社サイトのコンテンツをそのまま提供すると、自社サイトと寄稿先サイト両方に同じコンテンツが存在します。
この場合、自社サイトに掲載されているコンテンツを正規として、正しい評価を受けるべきです。しかし寄稿先のコンテンツがオリジナルと認識されてしまい、自社サイト側が正しく評価されない事態が起こり得ます。このようなパターンの重複コンテンツは、以下のような対策を実施しましょう。
クローラーは自動で分析・判断を行うため、重複コンテンツのどちらがオリジナルなのか正しく認識できないケースがあります。正しい評価を受けられるよう、寄稿先に協力を依頼することが大切です。
非常に悪質ですが、誰かにコンテンツを盗用された結果、重複コンテンツとみなされてしまうパターンもあります。Webページあるいはコンテンツが盗用されていると発覚した際、以下の対応を行いましょう。
コンテンツの盗用は著作権の侵害であり、明確な違反行為です。他者によるコンテンツ盗用の結果、自社サイトが重複コンテンツと認識されてしまう事態は、防止・回避する必要があります。コンテンツを盗用されている疑いがあれば、放置せず迅速に対処しましょう。
対策キーワードが同じ、似たテーマを扱っているなどの理由により、意図せず内容が他のコンテンツと類似していたパターンもあります。このような場合も重複コンテンツとみなされる恐れがあるため、発覚したらなるべく早く対応が必要です。コンテンツが類似してしまった場合の対処法として、以下の例があげられます。
意図した・していないに関係なく、似たような内容は重複コンテンツに該当してしまいます。「意図していない」を理由にせず、重複が発覚したら上記のような対策を行う必要があります。
異なるURLで内容が同じようなコンテンツは、重複コンテンツとみなされ、さまざまな不利益を受ける恐れが大きいです。他サイトをそのままコピーした重複コンテンツは論外ですが、Webサイトの種類によっては「気づかないうちに、自社サイト内で重複コンテンツが生まれてしまう」という可能性もあり得ます。
特にページ数の多いサイトでは、本記事で紹介したようなページが発生していないか定期的にチェックしてみてください。