月額定額制(サブスク)ホームページ制作 | ビズサイ
お役立ちコラム

重複コンテンツのSEOへの影響と対処法について

  
重複コンテンツのSEOへの影響と対処法について

重複コンテンツは、SEOにおいて検索エンジンに対しても、ユーザーに対しても重要な要素です。

SEOの経験が少ない方であれば、以下のような疑問が生じると思います。

『検索エンジン(Google)における重複コンテンツとは何?』
『重複コンテンツの対策方法は?』

重複コンテンツの定義を理解し、その対策方法を把握することは、SEOを行う上で避けては通れません。

今回のコラム記事では、SEOの経験がまだ少ない担当者様に向けて、重複コンテンツに関して説明するだけでなく、具体例や対処法についても解説を行います。

重複コンテンツとは

Googleの公式サイトには、重複コンテンツに関する定義が掲載されています。

一般に、重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、ほかのコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。

引用:重複コンテンツの作成を避ける

つまり、重複コンテンツに関して抑えておくべきポイントは、以下の2点です。

  • Webサイト内(ドメイン内)もしくは、ほかのWebサイト(他ドメイン)も含めて重複している
  • 重複とは、タイトルやテキストなどのコンテンツが全く同じ、または、ほぼ同じと判断されるものを指す

Webサイト内の重複コンテンツと、ほかのWebサイトで存在する重複コンテンツの2つのパターンに関して説明します。

Webサイト内に重複コンテンツが存在している

Webサイト内に存在する重複コンテンツの例として、以下のようなものがあります。

  • 「wwwあり」「「wwwなし」で同じコンテンツが表示される
  • 「/index.htmlあり」「/index.htmlなし」で同じコンテンツが表示される
  • 「http」「https」で同じコンテンツが表示される
  • スマートフォンとパソコンで別のURLにアクセスできる
  • ECサイトの製品ページで、カラーやサイズが違うだけの同じような製品ページが大量に自動で生成される
  • 定型文が多用されているWebページ
  • 印刷用のWebページ

上記の重複コンテンツに関しては、後述する対処法を参考にして適切に対策を講じれば、Googleのペナルティを受けるなどのリスクを最小限にすることができます。

ほかのWebサイトで重複コンテンツが存在している

ほかのWebサイトに存在する重複コンテンツの例を紹介します。

  • コンテンツをほかのWebサイトにコピーされた
  • 自分のWebサイトのコンテンツが、ほかのWebサイトのコンテンツがコピーだと判断された
  • 外部サイトに記事を提供している

これらの重複コンテンツに関しても、後述する対処法を参考に適切に対応することができるため、安心してください。

重複コンテンツのデメリット

重複コンテンツのデメリットには、以下の4点が挙げられます。

  • 検索結果に反映されない
  • 被リンク評価が分散する
  • ペナルティの対象になる
  • ユーザーの使い勝手が悪い

SEOでのデメリットとしては、検索結果に反映されない、被リンク評価が分散されるだけでなく、最悪の場合はGoogleにペナルティの対象になって検索順位が大幅に低下するリスクがあります。

また、重複コンテンツが多いとWebサイトの使い勝手が悪くなり、ユーザーが離脱してしまうというSEO以外のデメリットもあります。

なお、重複コンテンツとみなされた場合の対応策に関しては、のちほど説明します。
まずは、重複コンテンツによるデメリットに関して解説を行います。

検索結果に反映されない

Webサイト内で「wwwあり」「wwwなし」や印刷用のWebページなどで重複コンテンツが発生している場合は、基本的にはGoogleがどれかを選択して検索結果に表示します。

Googleの公式サイトでは、以下のように説明されています。

Google は、固有の情報を持つページをインデックスに登録して表示するよう努めています。たとえば、記事ごとに「通常」バージョンのサイトと「印刷」バージョンのサイトがあり、どちらも noindex メタタグでブロックされていない場合、Google はどちらか一方を選択して登録します。

引用:重複コンテンツの作成を避ける

検索結果に表示されないリスクがある重複コンテンツに関して、表にまとめました。

▼スマホの場合は横にスクロールしてご覧ください

Webサイト内定型文が多用されているWebページ
ほかのWebサイトコンテンツをほかのWebサイトにコピーされた
自分のWebサイトのコンテンツが、
ほかのWebサイトのコンテンツのコピーだと判断された
外部サイトに記事を提供している

ほかのWebサイトにコンテンツがコピーされたり、外部のWebサイトに記事を提供している場合、自分のコンテンツであっても重複コンテンツとしてみなされてしまい、検索結果に表示されない可能性がある点には注意が必要です。

被リンク評価が分散する

同じコンテンツであっても複数のURLがWebサイト内に存在する場合は、ほかのWebサイトからのリンクの評価が分散してしまうというデメリットがあります。

どのURLであっても同じコンテンツが表示される、よくある事例を表にまとめました。

▼スマホの場合は横にスクロールしてご覧ください

wwwあり、wwwなし・www.example.com
・example.com
/index.htmlあり、/index.htmlなし・example.com/index.html
・example.com/
http、https・http://example.com/
・https://example.com/

上記のURLで同じコンテンツが表示される(アクセスできる)状態は、ほかのWebサイトからの被リンクも、それぞれのURLに分散される可能性があります。

本来であれば、1つのURLで得られた被リンクの効果が、重複コンテンツが存在するため減少してしまうのです。

ペナルティの対象になる

重複コンテンツの中でも、最もリスクの高いケースを紹介します。

単なる重複コンテンツではなく「無断複製されたコンテンツ」つまり、ほかのWebサイトのコンテンツをコピーしたとGoogleに判断された場合は、Googleのペナルティを受けてしまうリスクがあります。

「無断複製されたコンテンツ」の例に関しては、Googleの公式ページに詳しく説明されています。

  • ほかのサイトのコンテンツをコピーし、独自のコンテンツや付加価値を加えることなく転載しているサイト
  • ほかのサイトのコンテンツをコピーし、(語句を類義語に置き換えたり自動化された手法を使用したりして)若干の修正を加えた上で転載しているサイト
  • なんらかの独自の体系付けやユーザーへの利便性を提供することなく、ほかのサイトからのコンテンツ フィードをそのまま掲載しているサイト
  • ユーザーに実質的な付加価値を提供することなく、ほかのサイトの動画、画像、その他のメディアなどのコンテンツを埋め込んだだけのサイト

引用:無断複製されたコンテンツ

上記のような事例に当てはまりGoogleによるペナルティの対象となった場合は、検索順位が大きく下がるといった悪影響があるため注意が必要です。

ユーザーの使い勝手が悪い

WordPressなどのCMSを使った場合によくある例として、特定のカテゴリーやタグで表示される内容が同じであるケースがあります。

カテゴリー分けやタグ付けを行い、ユーザーが探しやすいように分類することは大切ですが、記事が十分にストックされていない段階で多くのカテゴリーやタグを作成すると、重複コンテンツが発生してしまいます。

ユーザーの使い勝手も十分に考慮に入れて、重複コンテンツが発生しないように注意する必要があります。

重複コンテンツの調べ方

重複コンテンツであるかどうか調べる方法を、3点紹介します。

まずは「Google検索」で自分のWebサイトのコンテンツが検索結果に表示されるか確認します。

Googleの検索結果に自分のWebサイトのコンテンツが表示されない場合は、重複コンテンツとしてみなされている可能性があるため「sujiko.jp」というツールを使用して、どの程度コンテンツが類似しているのか調査します。

また、重複コンテンツの公開を未然に防ぐために「Copy Content Detector」というツールを使用し、コンテンツの公開前に類似したコンテンツがほかのWebサイトに存在していないか調べることができます。

これらの重複コンテンツの調べ方に関して解説します。

1.Googleで検索する

Googleで検索する方法は、素早く重複コンテンツが存在するかどうかを確認できます。

Webサイト内の一文もしくは一段落をコピー

Webサイト内の一文もしくは一段落をコピーします。

Google検索

出典:Google検索

コピーした文章をGoogle検索の検索窓に貼り付けて、検索します。

検索結果にほかのWebサイトのコンテンツが表示され、自分のWebサイトのコンテンツが表示されなかった場合は、重複コンテンツとしてみなされていると考えてよいでしょう。

なお、Googleで検索する際はシークレットモードで検索することによって、より正確に調べることができます。

シークレットモードを使わずに検索した場合は、検索結果に位置情報、過去の検索や閲覧履歴が反映されるため、自分のWebサイトが表示されやすくなるという点に注意してください。

2. sujiko.jpを使用する

Google検索で、自分のWebサイトのコンテンツが重複コンテンツとしてみなされてしまい、ほかのWebサイトのコンテンツが検索結果に表示される場合は「sujiko.jp」というツールを利用しましょう。

sujiko.jp

出典:sujiko.jp

sujiko.jpとは、無料で類似ページの判定ができるツールです。

重複コンテンツとしてみなされているWebサイトのURLと、Google検索結果に表示されているほかのWebサイトのURLを入力して「判定」ボタンをクリックするだけで、コンテンツの類似度として以下4点の判定結果が表示されます。

  • タイトル類似度
  • 本文類似度
  • HTML類似度
  • canonical指定

また、sujiko.jpには「サイト内類似ページ判定」と「サイト外類似ページ判定」の機能があります。

サイト内類似ページ判定は、自分のWebサイト内に類似したページ、つまり重複コンテンツとして判別される可能性のあるWebページがないか調べることができます。

サイト外類似ページ判定は、ほかのWebサイトに類似したページがないか調べることができるツールです。

これらのツールを活用し、重複コンテンツが自分のWebサイト内だけでなく、ほかのWebサイトに存在していないか確認するとよいでしょう。

3.Copy Content Detectorを使用する

自分のWebサイトでコンテンツを公開する前に、ほかのWebサイトで類似のコンテンツがないか調査するには、Copy Content Detectorを使うといいでしょう。

Copy Content Detector

出典:Copy Content Detector

Copy Content Detectorは、無料で文章のコピペチェックができるツールです。

記事の文章をコピーして、Copy Content Detectorに貼り付けて「チェックする」ボタンを押すだけでコンテンツの類似度が表示されます。

Copy Content Detectorの大きなメリットは、公開前のコンテンツであっても重複コンテンツに該当しないか調査できる点です。

一般的には外部のライターが執筆した記事が、ほかのWebサイトのコンテンツを無断で複製したものではないか確認する際に使われます。

重複コンテンツの対処法

重複コンテンツには、これまでに説明したように様々なケースがあり、対処法はそれぞれ違います。

主な重複コンテンツの例と対処法を表にまとめました。

▼スマホの場合は横にスクロールしてご覧ください

重複コンテンツの例対処法
・wwwあり、wwwなし
・/index.htmlあり、/index.htmlなしで同じコンテンツが表示される
URLの正規化(301リダイレクト)
ECサイトの製品ページで、色や容量が違うだけの同じような製品ページが大量に自動生成されるURLの正規化(canonicalタグ)
印刷用のWebページURLの正規化(canonicalタグ)
スマートフォンとパソコンで別のURLにアクセスできるアノテーション

これらの重複コンテンツの対処法に関して、くわしく説明を行います。

URLの正規化

以下のように同じコンテンツが複数のURLで表示される場合は「URLの正規化」と呼ばれる対応を行いましょう。

▼スマホの場合は横にスクロールしてご覧ください

URL例
wwwあり、wwwなし・www.example.com
・example.com
/index.htmlあり、/index.htmlなし・example.com/index.html
・example.com/

URLの正規化をするメリットは、分散していた被リンク評価が統一されるだけではありません。

検索エンジンのクローラーがインターネット上のWebページの情報を収集する際に、クロールしやすくなるため、検索結果に反映するためのインデックス登録がスムーズに行われやすいというメリットもあります。

URLを正規化する場合は、301リダイレクトを行う場合とcanonicalタグを用いる場合の2つのパターンがあります。

▼スマホの場合は横にスクロールしてご覧ください

URL正規化の方法詳細メリットデメリット
301リダイレクト旧URLから新URLへ「.htaccess」ファイルを用いて転送設定を行う・旧URLのSEO評価やアクセスを引き継ぐことができる・Webサーバーの知識が必要
canonicalタグhead要素の中に設定を記述し、URLの正規化を行う・301リダイレクトよりも簡単に実装できる
・検索結果に優先して表示させないWebページにもユーザーがアクセス可能
・確実にURLの正規化が検索結果に反映されるとは限らない

関連記事

URLの正規化について詳細は、以下のコラム記事で公開中です。

URLの正規化とは?正規化するべき3つの理由と具体的な方法を徹底解説

301リダイレクト

301リダイレクトとは、ドメインやWebページのURLを変更した際に、旧URLから新URLに恒久的に転送を行うHTTPステータスコードを指します。

ドメインやURLを変更した際に新しいURLへの転送が可能になるため、SEO上の効果があるだけでなくユーザーの使い勝手も向上するというメリットがあります。

301リダイレクトを用いることで、wwwあり・wwwなし、/index.htmlあり・/index.htmlなし、といった場合の重複コンテンツを解消することができます。

「.htaccess」ファイルをWebサーバーにアップすることにより、301リダイレクトの設定を行います。

関連記事

301リダイレクトについてもっと知りたい方は、以下のコラム記事をご覧ください。

301リダイレクトとは?書き方と設定方法を解説

canonicalタグ

Webサイト内または外部のWebサイトでの重複コンテンツに対して、どのURLを最も優先して検索結果に表示させるかを、canonicalタグを用いて記述します。

canonicalタグは、HTMLのhead要素内に記述するため、301リダイレクトよりも簡単に実装できる点がメリットです。

たとえば、ECサイトで色違いのTシャツを販売しており、色以外は同じコンテンツのWebページが複数存在している場合、canonicalタグを用いてURLの正規化を行います。

ただし、canonicalタグを使用したからといって、確実にURLの正規化が検索結果に反映されるとは限らない点には注意が必要です。

また、間違った方法でcanonicalタグを記述すると、正しくURLの正規化が行えないだけでなく、WebサイトのSEO上の評価が下がるというリスクもあります。

関連記事

canonicalタグについてもっと知りたい方は、以下のコラム記事をご覧ください。

canonical(カノニカル)タグとは?期待できるSEO効果と正しい使い方

アノテーションを行う

スマートフォン用やパソコン用などURLを分けている場合は、アノテーション(alternate)を行い、URLの正規化を行うことが可能です。

▼スマホの場合は横にスクロールしてご覧ください

URL
スマートフォンsp.example.com
パソコンexample.com

上記ケースの場合は、重複コンテンツとしてみなされる可能性があります。

そのため、優先して表示させたいURLにcanonical(カノニカル)タグを設定し、優先しないURLにはalternate(オルタネイト)タグを設定します。

現在のGoogleでは、スマホサイトが検索順位を決めるための評価基準となっています。
なので、スマートフォン用のURLにcanonicalタグを設定し、パソコン用のURLにalternateタグを設定しましょう。

コンテンツを削除

Webサイト内に重複コンテンツが存在する場合は、コンテンツを削除する、もしくは重複した内容のWebページを統合する、という対策も選択肢に入れておくとよいでしょう。

コンテンツの削除やWebページの統合に踏み切れない場合は、meta要素にnoindexタグを設定する方法があります。

noindexタグを設定することで、そのWebページはクローラーのクロール対象から外れるため、重複コンテンツになるリスクを下げることができます。

重複コンテンツに関する注意点

以下の2つのケースに当てはまる場合は、意図せず重複コンテンツとして判断されてしまうことがあるため、注意が必要です。

  • 外部サイトに記事を提供している場合
  • 動的ページでURLが自動的に生成される場合

これらの事例は、今まで説明したものよりも頻度は少ないものの、重複コンテンツとしてみなされる恐れがあるため、くわしく解説を行います。

外部サイトに記事を提供している場合

ニュースサイトなど、外部のWebサイトに記事を提供している場合の注意点は、以下の3点です。

  • 重複コンテンツとなる可能性を完全には排除できない
  • 検索結果には提供元、もしくは提供先の記事のどれか1つだけが表示される
  • 提供元の記事が検索結果に表示されるとは限らない

外部サイトに記事を提供している場合、提供元もしくは提供先のどの記事が検索結果に表示されるかは、Googleの判断次第であるという点には注意が必要です。

Googleの公式サイトには、以下の通り記載されています。

コンテンツをほかのサイトにシンジケーション提供している場合、あなたの判断とは無関係に、Google で最適と判断されたバージョンが常に表示されます。

引用:重複コンテンツの作成を避ける

提供元の記事が検索結果に表示されるようにするためオススメの対策は、配信先の記事にcanonicalタグを設置してもらうことです。

提供先の記事にcanonicalタグを設置することにより、提供元の記事がオリジナルの記事であることを検索エンジンに伝えることが可能です。

canonicalタグを提供先の記事に設置することが難しい場合は、提供先の記事にnoindexタグを設置してもらうとよいでしょう。

noindexタグを設置することにより提供先の記事がインデックスに登録されないため、提供元の記事が検索結果に表示されやすくなります。

また、提供先の記事から提供元の記事へのリンクを張ってもらうことにより、どの記事が提供元であるかという情報をGoogleに伝えることができます。

Googleの公式サイトでも、元記事へのリンクを張ることが有効であると説明されています。

コンテンツがシンジケーション提供される各サイトに元記事へのリンクを含めることは有効です。

引用:重複コンテンツの作成を避ける

これらの対策を提供先で実施することが難しい場合は、いくら提供元の記事であっても重複コンテンツとみなされる可能性が高まるため、外部サイトへの記事提供を行わないという選択も検討するとよいでしょう。

動的ページでURLが自動的に生成される場合

ECサイトなど、動的にURLが生成されるWebサイトを運営している場合は、canonicalタグ、もしくはGoogleサーチコンソールのURLパラメータ設定により、重複コンテンツとして判断されないように対策を行いましょう。

それぞれの設定方法に関して、解説を行います。

canonicalタグ

ECサイトでTシャツを販売している場合を例に説明します。

レッド、ブルー、イエローとそれぞれの色でURLが自動的に生成さる場合、Tシャツの色以外の情報はすべて同じであれば、重複コンテンツとしてみなされる可能性があります。

重複コンテンツとみなされるということは、Webサイトの評価が落ちSEOに関して悪い影響が発生する恐れがあります。

このような場合、canonicalタグを使用することにより、どのWebページを正規ページとするのか検索エンジンに伝え、重複コンテンツとして判断されるリスクを避けることが可能となります。

GoogleサーチコンソールのURLパラメータ設定

ECサイトでURLパラメータを用いて、表示されるコンテンツの内容を変更するケースがあります。

URLパラメータとは、以下の例であれば「?category=tshit&color=blue」の部分を指します。
https://example.com/women?category=tshit&color=blue

このように、URLの最後に「?=xxx」と情報を付け加えることにより、Webページに表示する内容を変えているECサイトが存在します。

ECサイトでは、商品の色やサイズで絞り込んだとしても、検索結果が変わらない場合があるだけでなく、自動的に生成されるURLと内容をコントロールすることが難しいため、重複コンテンツとして判断される可能性があります。

また、URLパラメータがことなっていても、表示される内容が同じケースもあります。

  • https://example.com/women?style=long,tshit
  • https://example.com/women?style=long&style=tshit

上記の場合も、重複コンテンツとして判断される可能性があるため対策が必要です。

このように、URLパラメータによって表示内容を変更している場合でも、URLパラメータがことなっていても表示する内容が同じ場合でも、重複コンテンツとしてみなされる恐れがあります。

そのため、Googleサーチコンソール内のURLパラメータ設定を用いて、重複コンテンツとして判断されないように対策を行います。

Google Search Console

出典:Google Search Console

Googleサーチコンソールにログインしたら、画面左のメニューから「以前のツールのレポート」→「URLパラメータ」をクリックします。

Google Search Console

出典:Google Search Console

「パラメータを追加」をクリックしたあとに制御したいパラメータを入力し、そのパラメータにより表示される内容が変わるかどうかを選択します。

コンテンツが変わる場合は、並び替え、絞り込みなど表示内容をどのように制御するのか選択し、GooglebotでクロールするURLの決定方法を選択し設定は完了です。

URLパラメータの設定は、設定方法を誤ると必要なWebページが検索結果に表示されなくなるといったトラブルが発生する可能性があります。

そのため、パラメータの仕様を十分に理解している担当者が、設定を行うことをおすすめします。

ほかのWebサイトにコピーされた場合

ほかのWebサイトにコンテンツをコピーされた場合は、コピーをしたWebサイトの運営者にお問合せフォームなどから削除要請を行いましょう。

コピーをしたWebサイトの運営者から連絡がない、もしくは誠意のある対応をしてもらえない場合は、Googleの著作権侵害の申告フォームで報告を行うことをおすすめします。

著作権侵害の申立が適正であるとGoogleに判断されれば、コピーしたWebサイトはGoogleのインデックスから削除されるため、検索結果から除外することができます。

まとめ

今回は重複コンテンツに関して説明するだけでなく、対策方法に関しても解説を行いました。

重複コンテンツに関して、重要なポイントは以下のとおりです。

  • 重複コンテンツは、Webサイト内(ドメイン内)だけでなく、ほかのWebサイト(他ドメイン)も含めて調査する必要がある
  • 重複コンテンツが存在していると、SEO上の悪影響だけでなくユーザーの使い勝手の面でも悪い影響がある
  • 重複コンテンツが存在している場合は、ケースごとに適切な対策を取ることが重要

重複コンテンツの発生を防ぐことにより、SEOでの悪影響を防ぐだけでなく、ユーザーに取って使いやすいWebサイトへ改善することにもつながるため、今回のコラム記事を参考に取り組んでみてください。

SEO対策に関する記事

まずは無料でご相談ください。

お問い合わせ・ご相談や、公開後の修正依頼などに関しては、いずれかの方法にてお問い合わせください。

※年末年始・土日祝は定休日となります
※受付時間 9:00~17:30

ビズサイで補助金使えます 最大450万円
×