SEO

最終更新日: 2022.07.19

重複コンテンツをチェックする方法は?基準や調べ方、対策方法も解説

重複コンテンツをチェックする方法は?基準や調べ方、対策方法も解説

重複コンテンツとは文字通り、内容の重複がみられるコンテンツのこと。重複コンテンツはSEOの観点上、好ましくないと考えられています。

しかし、そうは言っても「重複コンテンツがなぜ好ましくないのか」を知らなければ、どう改善すれば良いのか、次のアクションには移せません。そこで本記事では、重複コンテンツが好ましくない理由、重複ページの調べ方、対策方法を徹底解説します。

本記事をお読みいただくことで、重複コンテンツに対する適切な処置がわかり、効果的なSEO対策を立てられるようになるでしょう。SEO施策を担当している方、重複コンテンツについてお悩みの方は、ぜひ最後までお読みください。

重複コンテンツとは?

重複コンテンツとは?

重複コンテンツは異なるページURLで内容が類似している、あるいは被っているコンテンツを意味します。自サイト内部に限らず、外部サイトのコンテンツと重複してしまうケースもあります

また、自サイト内部での重複は検索結果に表示されにくくなる、被リンク評価が分散するなどのリスクが大きいです。Google検索での表示順位が下がり、SEO効果が弱くなってしまうケースもあります。

ペナルティ対象とまではなりませんが、SEO効果を高めるには、重複コンテンツは少ないのが理想です。一方、外部サイトのページコンテンツとの重複は、場合によってはペナルティの対象となります

Googleでは外部サイトのコンテンツのコピーを明確に禁止しているため、自サイト内でも同じようなコンテンツを意図的かつ悪質に公開している場合は、ペナルティ対象となり得ます。

重複コンテンツとみなされる基準

重複コンテンツとみなされる可能性のあるパターンとして、以下の3点があげられます。

  • URLは異なるが内容が重複している
  • 文章は異なるが記述内容が類似している
  • KWは違っても検索意図が類似している

単語や文章の順番が違っても、内容自体は同じであれば、重複コンテンツとみなされる可能性が高いです。なお自サイト内では、定型文の使用や似たテーマでのコンテンツ作成などにより、どうしても内容の重複が発生しがちです。またサイトの構造によっては、別のコンテンツで扱った内容でも記載したほうが良いケースもあります。

このような理由から自サイト内での重複コンテンツは、多くの場合ペナルティの対象とはなりません。もし自サイトのコンテンツ同士で重複がみられても、必ずしも修正する必要があるとは限らないのです。

重複コンテンツがSEO上よくないと言われる理由

重複コンテンツがSEO上よくないと言われる理由

重複コンテンツがサイト内にあると、SEO評価にどのような影響があるのかについては大きく分けて、以下の3点があります。

  • 類似したページは検索結果に表示されにくい
  • 受けられる被リンク評価が分散してしまう
  • 悪質なコピーコンテンツはペナルティの対象になる

それぞれ詳しく解説します。

類似したページは検索結果に表示されにくい

Googleは、類似したページを検索結果に表示させないという性質があります。すなわち重複コンテンツとみなされてしまうと、検索結果に表示されない恐れが大きいのです。Googleは検索結果を最適化したうえで表示させているため、ユーザーが混乱しないように類似したコンテンツは表示させない傾向が強いです。

Googleのクローラーは、さまざまなテーマ・内容のページをバランスよくインデックスしようとします。そして似たようなページはインデックスの必要がないと判断され、検索エンジンに登録されない可能性があるのです。結果として、せっかく作成し発信している記事コンテンツが、検索エンジンに表示されないという事態が起こり得ます。

受けられる被リンク評価が分散してしまう

受けられる被リンク評価が分散してしまうのも、重複コンテンツがSEO上よくないとみなされる理由のひとつです。

本来100の評価を受けられるはずのページについて、内容が重複しているコンテンツが存在すると仮定します。このような場合、100の評価が50と50などに分散してしまい、得られる評価が下がります。すなわち重複コンテンツの存在により、正しい評価が受けられなくなってしまうのです。

Google側が自動で処理をし、評価が分散せずに済む可能性もあります。しかし必ずしも正しい処理が行われるとは限りません。評価の分散は、得られるはずだった評価の取りこぼしともいえます。重複コンテンツの存在は、SEO効果を必要以上に低くする恐れが大きいです。

被リンクを受けるのはSEOでは重要?被リンクの調べ方と良質な被リンクを受ける方法 被リンクを受けるのはSEOでは重要?被リンクの調べ方と良質な被リンクを受ける方法

悪質なコピーコンテンツはペナルティの対象になる

重複コンテンツが悪質なコピーコンテンツとみなされると、ペナルティの対象となります。ペナルティを課された場合、検索順位が大幅に下がる、インデックスが削除され検索結果に表示されなくなるといった事態が起こり得ます。こうなると検索結果からの流入が期待できなくなってしまうでしょう。

悪質とみなされるケースとして以下の例があげられます。

  • 外部サイトのコンテンツをコピーし、付加価値などを加えずに自身のものとして転載
  • 外部サイトのコンテンツを言い回しを変えた程度で転載
  • 実質的な付加価値を提供せず、外部サイトのコンテンツフィードの掲載や、メディアの埋め込んだだけのWebサイト・ページ

また自サイト内部でも、ページ数を増やすために同じ内容のコンテンツを複数設置すると、悪質とみなされる恐れがあります。繰り返しになりますが、コピーコンテンツの掲載は、Googleのガイドラインで明確に禁止されている行為です。

重複コンテンツの調べ方やチェック方法は?

重複コンテンツの調べ方やチェック方法は?

重複コンテンツを調べる方法として、以下の2種類があります。

  • Search Consoleで調べる
  • チェックツールを使って調べる

それぞれの方法について詳しく解説します。

Search Console(サーチコンソール)で調べる

自サイト内での重複コンテンツを調べるなら、Googleが提供しているSearch Consoleが便利です。ペナルティの確認は、以下の手順で行います。

  1. Search Consoleにログイン
  2. 左側のメニューから「手動による対策」を選択
  3. 下に表示されたメニュー項目から「手動による対策」を選択
  4. 結果が表示されるため確認

遷移後のページで「問題が検出されませんでした」と表示されていれば、ペナルティを受けているページはありません。

チェックツールを使って調べる

重複コンテンツは専用のチェックツールを使って調べる方法もあります。チェックツールを活用すれば、重複コンテンツの恐れがあるページが存在しないか、何を改善するべきかなどが分析しやすくなります。今回紹介するチェックツールは以下の3つです。

  • sujiko.jp
  • CopyContentDetector
  • こぴらん

それぞれのツールについて詳しく解説します。

sujiko.jp

sujiko.jp

sujiko.jpは、類似判定したい2つのページを比較し、類似度を分析できるツールです。

費用 無料
会員登録 不要
ツールの使い方
  1. 類似判定したいページのURLを入力
  2. 入力窓の右にある「判定」をクリック
  3. タイトル・本文・HTMLの類似度、総合判定結果が表示される
利用できる回数 1日5回まで
ポイント・注意点
  • 重複コンテンツの恐れがあるページを認識している場合に便利
  • 無料・会員登録不要で実施できるため手軽
  • 重複コンテンツが存在するか明確でない場合には利用できない

sujiko.jpは、特定のページが「重複しているとみなされないか不安」といった場合に適したツールです。そのため、重複コンテンツが存在するか明確でない場合は、別のツールを活用するのが良いでしょう。

CopyContentDetector

CopyContentDetector

CopyContentDetectorは、入力したテキストがWeb上に存在するコンテンツの内容と重複していないかチェックできるツールです。コピペチェックツールとして多く使われています。

費用 無料でも利用可能
有料プランは月1,000円もしくは6,000円(税込)
会員登録 会員登録しなくても利用可能
ツールの使い方
  1. 「調査対象テキスト」欄に調べたいテキストをペースト
  2. 必要に応じて除名ドメイン・言語モードなどの設定を変更
  3. 「規約に同意してコピペチェックする」を選択
  4. チェックが完了すると通知が届くためページを更新
  5. ページ下部の「コピペチェック結果一覧」で結果を確認
利用できる回数(無料の場合)
    • CSV・テキスト登録数は上限1日30件
    • 1回でチェックできる文字数は上限4,000字
ポイント・注意点
  • Web上に存在するコンテンツとの類似度・一致率などが判定できる
  • 類似している可能性の高いコンテンツを絞り込める
  • 1回でチェックできる文字数がやや少ないため注意

公開前のコンテンツについて、他社サイトとの重複の恐れがないかを確認する際に役立ちます。

こぴらん

こぴらん

こぴらんは、入力したテキストがコピーコンテンツに該当しないかをチェックできるツールです。シンプルな仕様のため、簡易的なチェックに役立ちます。

費用 無料
会員登録 不要
ツールの使い方
  1. 入力フォームにチェックしたいテキストを入力
  2. フォーム下の「チェック」を選択
  3. 入力した文章が分解され、それぞれの文ごとに類似有無の結果が表示される
利用できる回数 制限なし
1回の文字数は上限4000字
ポイント・注意点
  • 文章ごとに類似の恐れをチェックできる
  • レスポンシブWebデザインを採用しており、PC・スマートフォン・タブレットなどさまざまなメディアで利用可能
  • あくまで簡易的なツールのため、高い精度でのチェックはできない

簡易的なツールですが、重複コンテンツを調べるには十分といえます。手軽にチェックしたい場合などに使うと良いでしょう。

重複コンテンツの対策を状況別に紹介

重複コンテンツの対策を状況別に紹介

重複コンテンツが見つかった場合は、可能な限り対策するのが理想です。しかし一言で対策といっても、重複コンテンツの状況によって効果的な方法が異なります。そのため状況に合わせた対策が必要です。今回紹介するのは以下6パターンです。

  • URLの表記に一貫性が保たれていないパターン
  • 動的URLによって重複コンテンツが生成されてしまうパターン
  • PC用・スマホ用にそれぞれ別のURLを設けているパターン
  • 他サイトにコンテンツを提供しているパターン
  • 誰かにコンテンツを盗用されたパターン
  • 意図せず内容が他のコンテンツと類似していたパターン

それぞれのパターンについて、対策方法を詳しく解説します。

1. URLの表記に一貫性が保たれていないパターン

重複コンテンツに多いのが、URLの表記に一貫性が保たれていないパターンです。運営側としては同じページとして扱っているものの、URL表記が複数あると、同じ内容のページが重複しているとみなされてしまいます。URLが統一されていない例として、以下のようなケースがあげられます。

  • URL末尾に「index.php」がついているorいない
  • 先頭に「www」がついているorいない

このような場合には、どれかひとつを正規化して明示する対応が必要です。対処法として、以下2種類の方法があげられます。

  • 301リダイレクト
  • canonica

どちらの方法が良いかはサイトの状況や目的によって異なります。そのため自社サイトに合わせた対策が必要です。それぞれの方法について詳しく解説します。

301リダイレクトにしたほうがいい場合

ユーザーがアクセスするURLが1つのみでよいなら、301リダイレクトが効果的です。301リダイレクトとはページに訪問したユーザーを、設定した別のURLへ自動で遷移させる処理です。

たとえば先頭に「www」がついているページを正規URLとする場合、「www」がついていないページに301リダイレクトを設定します。すると「www」のついていないページに訪問したユーザーは、自動的に「www」のついたページ、すなわちコンテンツが掲載された正規コンテンツへ移動するのです。

301リダイレクトを設定すれば、正規URL以外のページにはコンテンツを掲載させる必要がなくなります。したがって重複コンテンツの存在を防げるのです。

リダイレクトとは?正しい設定方法や警告が出たときの対処法も詳しく解説! リダイレクトとは?正しい設定方法や警告が出たときの対処法も詳しく解説!

canonicalにしたほうがいい場合

同じコンテンツを別々のURLのまま運用したい場合には、canonicalを実施しましょう。canonicalとは検索エンジンに正規URLを伝えるために記述するタグです。canonicalを設定することで、似た内容のページが複数存在する中から、正規URLとして扱うべきページを判断できます。

ただしcanonicalは命令ではなく、あくまでクローラーに対するヒント・案内という役割です。そのためページのアクセス数が多いなど、ケースによってはcanonicalを記載したページ以外を正規URLとして判断する可能性もあります。正規URLとしたいページ以外には、命令の性質を持つnoindexタグ(検索エンジンへの登録を防ぐ)を利用するのが確実です。

canonicalタグとは?URL正規化やcanonicalタグの正しい記述方法を解説 canonicalタグとは?URL正規化やcanonicalタグの正しい記述方法を解説 少しSEOに詳しい人ならcanonicalタグについて聞いたことがあるでしょう。では、どんな時に設定すべきかを正確に説明できるでしょうか?理解しているようでイマイチわからないcanonical属性について解説します。

2. 動的URLによって重複コンテンツが生成されてしまうパターン

動的URLによって重複コンテンツが生成されてしまうパターンも存在します。こちらは多くの場合、システムの仕様によるものです。

たとえば遷移元のページによって、同じ内容のページなのに遷移先のURLが変わってしまう事態が起こり得ます。ECサイトで色違いの賞品を見せるときに、パラメーターだけ変わってしまうケースもあります。このような場合も重複コンテンツとみなされてしまうため、早めに対処できるのが理想です。

動的URLが原因の場合は、canonicalによる正規URLの設定、もしくはSearch Consoleでのパラメータ設定が適切です。Search Consoleでのパラメータ設定については、次の章で詳しく解説します。

Search Consoleでのパラメータ設定方法

Search ConsoleにはURLパラメータツールが存在します。パラメータツールでは、以下のような設定が可能です。

  • URLパラメータによるコンテンツ変化の有無の明示
  • パラメータを含むURLのうち正規URL(クロール対象)とするページの指定

パラメータを設定すれば、重複コンテンツによるSEO効果の低減リスクをおさえられるのです。パラメータ設定は以下の手順で行います。

  1. URLパラメータを開く
  2. パラメータ一覧の右側にある「編集」を選択
  3. パラメータによるコンテンツの変更がない場合「いいえ:~~」を選択
    コンテンツの変更がある場合「はい:~~」を選択し、GoogleでクロールするURLの設定などを行う

ただしパラメータの作用が不明の場合には、誤った設定のリスクを防ぐため、設定の変更を避けたほうが無難です。

3. PC用・スマホ用にそれぞれ別のURLを設けているパターン

PC用・スマホ用にそれぞれ別のURLを設けているパターンも、重複コンテンツとみなされる可能性が高いです。この場合は主に2種類の対策があげられます。

  • PC・スマホどちらも同じURLを使う
  • アノテーションを設定する

閲覧するメディアを問わないレスポンシブWebデザインを活用すれば、URLを分けずに済みます。しかしこの方法はデザインを大きく変える必要があり、手間・コストが大きいです。またサイトによっては実施できないケースもあります。

したがってPC用・スマホ用に別のURLを設けている場合は、アノテーションの設定が便利です。アノテーションとはデバイスごとに異なるURLを提供しているという事実を、検索エンジンに伝えるための処理です。アノテーションは以下の流れで設定します。

  1. PCページの要素内で、スマホやタブレット用ページのURLへalternateタグを設定する
    ※alternateタグ:代替用ページの存在を知らせるタグ
  2. スマホやタブレット用ページの要素内で、PC向けページのURLにcanonicalタグを設定する

アノテーションにより、重複コンテンツとしてみなされてしまうリスクをおさえられます。

4. 他サイトにコンテンツを提供しているパターン

続いて紹介するのは、他サイトにコンテンツを提供しているパターンです。ニュースサイトなどに、自社サイトのコンテンツをそのまま提供すると、自社サイトと寄稿先サイト両方に同じコンテンツが存在します。

この場合、自社サイトに掲載されているコンテンツを正規として、正しい評価を受けるべきです。しかし寄稿先のコンテンツがオリジナルと認識されてしまい、自社サイト側が正しく評価されない事態が起こり得ます。このようなパターンの重複コンテンツは、以下のような対策を実施しましょう。

  • 提供先にcanonicalを設置してもらう:自社サイトを正規URLとして認識してもらえる可能性が高まります
  • オリジナルコンテンツへのリンクを提供元として紹介してもらう:この方法でも、クローラーに自社サイトをオリジナルとして認識してもらえます

クローラーは自動で分析・判断を行うため、重複コンテンツのどちらがオリジナルなのか正しく認識できないケースがあります。正しい評価を受けられるよう、寄稿先に協力を依頼することが大切です。

5. 誰かにコンテンツを盗用されたパターン

非常に悪質ですが、誰かにコンテンツを盗用された結果、重複コンテンツとみなされてしまうパターンもあります。Webページあるいはコンテンツが盗用されていると発覚した際、以下の対応を行いましょう。

  1. 該当のサイトに直接削除依頼を行う
  2. Googleの連絡フォームから「著作権侵害通知」を提出し、該当ページのインデックス登録削除を依頼
    ※連絡フォームはこちら「Google|著作権侵害による侵害

コンテンツの盗用は著作権の侵害であり、明確な違反行為です。他者によるコンテンツ盗用の結果、自社サイトが重複コンテンツと認識されてしまう事態は、防止・回避する必要があります。コンテンツを盗用されている疑いがあれば、放置せず迅速に対処しましょう。

6. 意図せず内容が他のコンテンツと類似していたパターン

対策キーワードが同じ、似たテーマを扱っているなどの理由により、意図せず内容が他のコンテンツと類似していたパターンもあります。このような場合も重複コンテンツとみなされる恐れがあるため、発覚したらなるべく早く対応が必要です。コンテンツが類似してしまった場合の対処法として、以下の例があげられます。

  • 複数の情報源から情報を収集する:参考にする情報源が増えれば、特定のコンテンツの内容に似すぎてしまうリスクが下がります
  • 自分の言葉で文章を作る:情報源を複数参照しつつ、得た知識を頭に入れたら、自分の言葉で表して文章を作るよう意識が大切です
  • コンテンツマップを作って整理する:自社サイト内で気づかないうちに同じような内容の記事を作ってしまうケースもあります。このような事態を防ぐには、コンテンツマップの活用が便利です

意図した・していないに関係なく、似たような内容は重複コンテンツに該当してしまいます。「意図していない」を理由にせず、重複が発覚したら上記のような対策を行う必要があります。

重複コンテンツのチェックまとめ

重複コンテンツのチェックまとめ

異なるURLで内容が同じようなコンテンツは、重複コンテンツとみなされ、さまざまな不利益を受ける恐れが大きいです。他サイトをそのままコピーした重複コンテンツは論外ですが、Webサイトの種類によっては「気づかないうちに、自社サイト内で重複コンテンツが生まれてしまう」という可能性もあり得ます。

特にページ数の多いサイトでは、本記事で紹介したようなページが発生していないか定期的にチェックしてみてください。

監修者紹介

石田 哲也

石田 哲也

取締役CMO

Twitter:@te2319
株式会社ニュートラルワークス 取締役CMO。1984年生まれ。高校卒業後にISD株式会社にて起業。株式会社オプトにてWebマーケティングを学び、株式会社メタップスなど複数のベンチャー企業にて事業立ち上げを経験。前職はワンダープラネット株式会社にてゲームプロデューサーとしてスマホアプリゲームの制作に従事。2018年に地元の神奈川へ戻り、ニュートラルワークスにジョイン。SEO/Web広告運用/サイト分析・改善など、Webサイトの運用改善~ゲームアプリ制作や数十万フォロワーのSNSアカウントの運用経験などWebビジネス全般を守備範囲とする。

■経歴
2003年 ISD株式会社/起業
2009年 株式会社オプト/SEMコンサルタント
2011年 株式会社メタップス/シニアディレクター
2013年 ライブエイド株式会社/執行役
2016年 ワンダープラネット株式会社/プロデューサー・BizDev
2018年 株式会社ニュートラルワークス/取締役CMO

■得意領域
Webサイト改善
SEO対策
コンテンツマーケティング
リスティング広告

■保有資格
Google アナリティクス認定資格(GAIQ)
Google 広告検索認定資格
Google 広告ディスプレイ認定資格
Google 広告モバイル認定資格