PINTO!株式会社PLAN-Bの情報発信メディア

2018.01.24

蔦 友也

SEO SOLUTION

目次
    1. そもそも重複コンテンツとは?
      1. サイト内部で同じようなコンテンツが存在する
      2. 他のサイトで同様のコンテンツが掲載されている
    2. なぜ重複コンテンツはよくないのか?
      1. 01:検索結果に表示されない
      2. 02:サイト内に重複したページがあることで被リンク評価が分散される
      3. 03:ペナルティ対象となる
    3. 重複コンテンツを調べる方法
    4. 重複コンテンツと考えられる場合とその対処法
      1. 01:URLが正規化されていない場合
        1. 対処法1:301リダイレクト
        2. 対処法2:canonicalタグの設置
        3. 対処法3:alternateタグ
      2. 02:動的ページで自動的にURLが生成される場合
        1. 対処法1:canonicalによる正規化
        2. 対処法2:URLパラメータ設定
      3. 03:定型文が繰り返されている場合
        1. 対処法:オリジナルコンテンツの設置
      4. 04:他のサイトにコンテンツを提供している場合(シンジケーション)/他のサイトにコンテンツを盗用された場合
        1. 対処法1:重複先サイトの評価をさせない
        2. 対処法2:削除申し立て
      5. 05:他のサイトへのコンテンツを自社サイトでコピーして使っている場合
        1. 対処法
      6. 06:一覧ページと詳細ページの内容が重複している場合
        1. 対処法
    5. まとめ

2012年7月に行われたパンダアップデートは、低品質なコンテンツの順位を下げるGoogleの検索アルゴリズム・アップデートとして、SEO担当者ならほとんどの方がご存知かもしれません。

Googleが“低品質なコンテンツ”として扱っているもののひとつに「重複コンテンツ」があります。同じ内容のページがネット上に複数あるとどちらのページが検索クエリの検索意図に最も適しているのか判断が難しくなるため、Googleは重複コンテンツを嫌います。

今回は「重複コンテンツとは何か?」「重複コンテンツ」を避けるサイト運営方法をご紹介します。


そもそも重複コンテンツとは?

重複コンテンツは、サイト内部と外部で同じようなコンテンツが掲載されている状態を指します。大別すると、以下の2つの種類があります。

サイト内部で同じようなコンテンツが存在する

仕様上の問題(wwwありなしの統一、システムの都合上自動的に生成されてしまうページ)や定型文の繰り返しによって重複が生じる場合があります。

他のサイトで同様のコンテンツが掲載されている

自社サイトの文章の盗用や、他のコンテンツをコピーしてしまったことで生じる場合があります。

故意に行う場合はもちろんですが、サイトの仕様上起こってしまう問題も考えられるので、どういった場合に起こりうるのかを知り、適切に対処することが必要です。


なぜ重複コンテンツはよくないのか?

重複コンテンツがよくない3つの理由

01:検索結果に表示されない

Googleのbotは、様々なページをバランスよくインデックスしようとする傾向があります。そのため、同じ(似たような)ページがたくさんあれば、それらのページがクロールされる可能性が減少します。

また、Googleはできる限り違う内容のページを表示することによってユーザーの混乱を避け、検索の利便性向上を図っているため、似たようなページは検索結果に出現させないように調整しています。すなわち、似たような内容のページは検索結果には表示されないことになります。

02:サイト内に重複したページがあることで被リンク評価が分散される

サイト内部で重複したページが存在すると、被リンク評価が分散される恐れがあります。

例えば、重複したページがAとBの2つ存在している場合、本来であれば1つのページに100あるはずの評価は、

A:50

B:50

という評価に分散される可能性があります。

Googleからの評価は自動的にひとつに処理されることもありますが、100%の評価を正しく受けることができない状態は上位表示の妨げになるかもしれません。

03:ペナルティ対象となる

冒頭で紹介したパンダアップデートにより、「無断でコピーされたコンテンツ」はペナルティの対象となります。

検索順位向上を狙って他社サイトのコンテンツを盗用したり、故意にページ数を増やすため同じ内容のページをサイト内部に複数設置させたりすることは、悪質なサイト運用とみなされる恐れがあるため注意が必要です。

サイトを構成するにあたって重複コンテンツは避けておきたいところですが、過度でなければすぐに評価を下げる対象にはなりません。(サイト運営上、悪質とされる以外のものにおいて重複コンテンツは自然と発生するものとGoogleも判断しているためです。)


重複コンテンツを調べる方法

コンテンツを見直して対処する場合は、重複判定をする必要があります。最も早い方法は、検索エンジンで自社のコンテンツ内容の一部を検索する方法です。

検索結果に自社ではないページが上位表示された場合、同じ内容のコンテンツである可能性が考えられます。

さらに、自社より上位に表示されているサイトを確認してみましょう。

Ctrl+Fのページ内検索にて同じコンテンツがあるかを確認し、重複しているコンテンツがあれば表示されます。

ページ内検索

(対象のコンテンツをドラッグして右クリックでGoogle検索を行うことができます。)

検索結果

(この場合、検索結果は1位であり、対象のコンテンツと重複はないと考えられます。)

より精度の高い方法で検証したい人は、コピーコンテンツチェックルツールが便利です。


重複コンテンツと考えられる場合とその対処法

重複コンテンツとみなされる場合としては、以下の7つが挙げられます。特にページを追加する場合や他のサイトへコンテンツを提供するような場合は、重複について注意を払っておく必要があります。

01:URLが正規化されていない場合

  • URL末尾のindex有り・無しのURLが混在
  • www有り・無しのURLが混在
  • https・httpの統一ができていない
  • 独自ドメインと初期ドメイン
  • PC用のURLとSP・モバイル用のURLが混在

対処法1:301リダイレクト

301リダイレクトはブラウザや検索エンジンに対し、URLが転送されたことを示す方法です。

例えば、

  • www.example.jp
  • example.jp
  • www.example.jp/index.html
  • example.jp/index.html

と4つのURLが存在する場合、対象となる「www.example.jp」を正規化するURLとして301リダイレクトを行うと「www.example.jp」に転送され、URLを統一することが可能です。

対処法2:canonicalタグの設置

htmlの<head>内に統一するURLのcanonicalタグを設置することでURLを正規化することが可能です。

例えば、「www.example.jp」が統一したいURLの場合、下記を<head>内に記載することによりGooglebotに正規URLを認識させます。

※301リダイレクト、canonicalタグの違い

統一するURLが決まっている場合は転送されたほうがURLもユーザーに認識されやすいため、URLを正規化する際には301リダイレクトが 推奨されます。301リダイレクトはhtaccessファイルによりサーバー側から転送させる処理です。

サーバーの中にはhtaccessファイルに対応できないものもあります。環境要因により301リダイレクトが不可能な場合はcanonicalタグにて対応する必要があります。

対処法3:alternateタグ

PC用とSP・モバイル用のURLになっている場合はalternateタグを設定する方法があり、PC用ページにSP・モバイル用のページを記述しクローラーに知らせていきます。

以下のalternateタグを<head>内に記載します。

併せてSP・モバイル用ページへPC用ページのcanonical設定も忘れてはいけません。canonicalタグはSPページをPCページに正規化するために必要となります。

02:動的ページで自動的にURLが生成される場合

  • システムの仕様上、カテゴリページから遷移した場合とサイト内の関連リンクから遷移した場合とでは流入経路が違うため、同一ページなのに違うURLが生成されてしまう。
  • ECサイトなどにおいて色違いのページを表示する際に画像以外同じ内容のページが自動的に生成されてしまう。

対処法1:canonicalによる正規化

正規化するページのURLをcanonicalタグにて設置することにより、評価を統一させることが可能です。

対処法2:URLパラメータ設定

GoogleSearchConsoleの機能内に、URLパラメータという項目があります。このURLパラメータ設定を行うことで、複数URLページをGoogleに認識させることが可能です。

それぞれ動的に振り分けられているURLに対してGoogleのクロールをさせるか否かという設定により、評価対象から外すことで重複を回避します。

03:定型文が繰り返されている場合

サイト内部のテキスト量を増やすことを目的として全ページに同じ文章を入れてしまう。

対処法:オリジナルコンテンツの設置

重複コンテンツ調査ツール(次項にて説明)にて重複度合をチェックし、それぞれのページに重複しないコンテンツを設置していくことが必要です。

04:他のサイトにコンテンツを提供している場合(シンジケーション)/他のサイトにコンテンツを盗用された場合

対処法1:重複先サイトの評価をさせない

異なるドメイン間で重複コンテンツが発生している状態であれば、提供先へ該当のURLをrobots.txtにてクロール拒否設定してもらうか、提供元のURLを設置してもらうという対処方法があります。

提供元の評価をさせないことにより、オリジナルコンテンツの評価を正しくさせることにつながります。

対処法2:削除申し立て

意図せずに引用された場合の対処方法としては、そのサイトの運営者へメールなどにより、削除の申し立てが必要です。対応してもらうことが難しく、流入を奪われている状況ならGoogleSearchConsoleから検索エンジンへ申し立てすることも可能です。

著作権侵害による削除リクエストフォームを活用し、必要事項を入力、送信し、Googleから著作権侵害となるものと判断されれば、対象先のインデックスは削除されることとなります

(GoogleSearchConsoleの著作権侵害による削除リクエストフォーム)

05:他のサイトへのコンテンツを自社サイトでコピーして使っている場合

自社ペナルティの対象となる代表例です。オリジナルコンテンツの運用を心掛けてください。

対処法

他社サイトのコピーコンテンツを削除し、独自のコンテンツを追加する。

06:一覧ページと詳細ページの内容が重複している場合

コラム記事一覧などの一覧ページは詳細ページの一部をそのまま抜粋している場合があり、重複とみなされる可能性があります。

対処法

コラム記事一覧の概要などを書き換えたり追加したりすることで、詳細ページからの重複がないオリジナルコンテンツにする。


まとめ

以上、Googleの嫌う重複コンテンツについてご紹介しました。

重複コンテンツはサイト運営上自然と発生してしまうものもありますが、重複内容によっては軽視できないものもあります。重複コンテンツのままサイト運営を行っていると自ずとサイトの質は低下していきます。

上記で説明した重複コンテンツ例と適切な対処を行い、独自性の高いサイト運営を心掛けましょう!

SEOをもっと学びたい方はこちらもチェック:SEO対策の全てを紹介!