インターネットアーカイブとは? 過去のサイトの確認方法、ツールの使い方

コンテンツライティングチェックシート【30項目】
今すぐ無料ダウンロード
コンテンツライティングチェックシート【30項目】
今すぐ無料ダウンロード
目次
    1. 「インターネットアーカイブ」とは
    2. Wayback MachineのSEOへの活用法
      1. Webサイトの外観の変化と変更された時期を確認する
      2. URL構造の変化を確認する
      3. ソースコードの変更を確認する
    3. 目的別のWayback Machineの使い方
      1. Webサイトの過去の状態を確認する
      2. 手動でサイトのデータを保存する
      3. 保存されているデータを削除する
    4. 過去のサイトを確認できるツール6選
      1. 1.Wayback Machine(アメリカ)
      2. 2.Stanford Web Archive Portal(アメリカ)
      3. 3.WARP(日本)
      4. 4.Library of Congress(アメリカ)
      5. 5.UK Web Archive(イギリス)
      6. 6.ウェブ魚拓(日本)
    5. まとめ

過去のWebサイトを参照してSEO対策に活かしたい。そんなときは、非営利団体「インターネットアーカイブ」が運用する「Wayback Machine」の出番です。過去に公開されていたWebサイトの情報をまるごと保存しているWayback Machineでは、リンクが切れたWebサイトからすでに削除されたWebサイトまで、全て無料で閲覧できます。自社や競合他社をはじめ、様々な企業のコーポレートサイトの変遷を参照してWebサイトの改善に役立てましょう。

本稿では、Wayback Machineの概要や使い方、オススメのWebアーカイブサービス6選を紹介します。

「インターネットアーカイブ」とは

「インターネットアーカイブ」とは非営利団体の名称で、同団体が運用するサービス「Wayback Machine」がWeb上をクロールし、Webサイトの情報を収集・保存しています。Webサイト以外にもソフトウェアや音楽、動画、書籍のデジタルデータも保存しており、現時点で保存されているデータ量は6,820億ページにのぼるそうです(2022年5月現在)。

Webサイトの変遷を保存し続け、膨大な量のアーカイブを提供してくれるWayback Machine。本来は研究者への情報提供を前提としているとのことですが、サイトのパフォーマンスを分析するなど、SEO対策を行う際にも大いに活躍してくれるサービスです。

これまでGoogleの検索エンジンはアップデートを定期的に繰り返し、その度に検索順位に影響を与えてきました。これらアップデートに対してどのようにWebサイトを改善して順位を上げてきたのか。Wayback Machineで過去の変遷をたどることで、改善のヒントが得られるかもしれません。

ちなみにSEO対策を目的とする場合、以下のようなタイミングでWayback Machineが利用される傾向があります。

■過去のWebサイトの状態を知りたいとき

Wayback Machineには削除されたWebページも保存されているため、過去のWebサイトの状態を検索・閲覧することができます。コンテンツ削除によるリンク切れサイトの閲覧や、ドメインが変わったサイトを閲覧をしたいときに便利です。

■検索順位の変動時にWebサイトの変更内容を確認したいとき

過去のWebサイトが保存されているため、自社サイトの検索順位が変動したときに過去のサイトと現在のサイトを見比べて変更内容を検討することができます。検索順位を上げるために必要なコンテンツの洗い出しやリライト時に活用されています。

■削除したWebページを閲覧可能にしておきたいとき

Wayback Machineにはサーバーから削除された情報も保存されています。例えば、「公開状態にはしておけないが、コンテンツの情報は残しておきたい」といった場面で、別途WebサイトのURLを保存しておくことができます。

またWayback Machineから取得した情報を分析する上で、「Googleアナリティクス」や「Googleサーチコンソール」といったアクセス解析のツールが必要です。下記の記事に詳細をまとめていますので、ぜひご一読下さい。

Wayback MachineのSEOへの活用法

ここからは、SEO対策でWayback Machineを活用する方法についてご紹介します。

Webサイトの外観の変化と変更された時期を確認する

Wayback Machineはクロールの頻度が高くサイトの状態が細かく保存されているため、検索順位とWebサイトの外観変更の関係性を調べることができます。例えば、あるWebサイトの外観が大きく変わったとき、検索順位はどのように変化したのか。変更の意図と順位変動の結果を鑑みて、自社のWebサイト改善に活かすことができます。

URL構造の変化を確認する

Wayback Machineには過去のURLデータも保存されているため、サイトの外観と同様にURLの変更箇所と変更した時期の確認ができます。また中古ドメインを使用する際は、Wayback Machineで過去のペナルティ履歴や被リンクの数等を確認し、ドメインの質や強さを確認するのもオススメです。

関連記事として、下記の記事ではサイトの強さ(信頼性)を数値で表す「ドメインオーソリティ」について解説しています。ご興味のある方は本稿とあわせてご覧ください。

ソースコードの変更を確認する

Wayback MachineはWebページのソースコードも記録しているため、過去のHTMLやCSSも確認できます。「Googleアナリティクス」等のツールでサイトの数値を計測し、過去の数値に異常があった場合は「当時のトラッキングコードが適切に配置されていたか」を調査してみましょう。Wayback Machineでソースコードを確認したいページのURLを検索し、右クリックで問題があった日付のソースコードを取得してみてください。

目的別のWayback Machineの使い方

ここからは目的に応じた「Wayback Machine」の使い方をご紹介します。 

詳しくはこちらの記事もご確認ください。

Webサイトの過去の状態を確認する

Wayback MachineでWebサイトの過去の状態を確認したい場合は、以下の手順で操作します。

STEP 01:Wayback Machineにアクセス。

STEP 02:赤枠に過去の状態を確認したいWebサイトのURLを入力し、青枠の「BROWSE HISTORY」をクリック。

STEP 03:画像のようなカレンダーが表示されます。

STEP 04:閲覧したい年を指定します。

STEP 05:閲覧したい年に移動したら、今度は閲覧したい月日を指定しましょう。下の画像のように、青い丸が付いている日付がデータが保存されている日です。その日付をクリックすると該当する過去ページに移動できます。

 

手動でサイトのデータを保存する

Wayback Machineは自動でWebサイトの状態を保存しますが、保存されるタイミングが不明です。したがって、Webサイトが更新されるたびにデータが逐一保存されているかは分かりません。今この瞬間にデータを保存したい場合は手動での保存がオススメです。以下では手動でデータを保存する方法を説明します。

STEP 01:赤枠に保存したいページのURLを入力し、青枠の「SAVE PAGE」をクリックします。

STEP 02:URLを入力すると保存処理が開始されます。終了すると「Done!」と表示され完了です。

保存されているデータを削除する

Wayback Machine上に保存されている過去のWebページを削除したい場合は、Wayback Machineを運営しているインターネットアーカイブ(info@archive.org)にメールを送り削除を依頼しましょう。上記アドレスに削除したいページのURLと運営者の証明を送信することで、アーカイブから過去データが消去されます。ただし、インターネットアーカイブはアメリカに拠点を置く団体ですので、メールのやりとりは全て英語です。

過去のサイトを確認できるツール6選

最後に、Webサイトの過去の状態を参照できるオススメのWebアーカイブサービスをご紹介します。

1.Wayback Machine(アメリカ)

Wayback Machineは、アメリカの非営利団体である「インターネットアーカイブ」が保存している無料でWebサイトを閲覧できるサービスです。世界中のWeb情報を収集しており、2022年5月現在で6,820億ページものWebページがアーカイブされています。クロールの頻度が高く保存数が多いのが特徴で、他のアーカイブサービスでは見つけられないWebページもWayback Machineであれば閲覧できるかもしれません。


公式サイト:https://web.archive.org

2.Stanford Web Archive Portal(アメリカ)

「Stanford Web Archive Portal」は、アメリカのスタンフォード大学が運営するWebアーカイブサービスです。アメリカの大学が運用するサービスですが、日本語のWebサイトも一部収集されています。検索方法やサイトデザインが「Wayback Machine」と酷似しているので、同Webサイトの使用経験がある方にとっては快適に使用できるはずです。

公式サイト:https://swap.stanford.edu

3.WARP(日本)

「WARP」は国立国会図書館が運用している「インターネット資料収集保存事業」です。収集対象は日本国内に限定。国の機関や地方自治体、独立行政法人、国公立大学などの公的機関のWebサイトを収集し、民間のWebサイトに関しては発信者の許可を取って保存しています。WARPは小規模なターゲット単位で収集を行なっており、各ターゲットごとに収集の頻度を決めて運営されているのが特徴です。

公式サイト:https://warp.da.ndl.go.jp/?_lang=ja

4.Library of Congress(アメリカ)

「Library of Congress」は米国議会図書館が運営するWebアーカイブサービスです。1つのWebサイトに対して、週1回、月1回、四半期に1回といった頻度で収集を行なっているようです。収集されたWebサイトは、収集日から1年が経過したら発信者の許可を得てWeb上で公開される仕組みとなっています。また、数は多くありませんが日本語のサイトも収集されています。

公式サイト:https://www.loc.gov

5.UK Web Archive(イギリス)

「UK Web Archive」はイギリスの大英図書館が運営するWebアーカイブサービスで、イギリス政府が情報発信をする際にTwitterやYouTubeを頻繁に利用している影響で、そういった情報も「公的な記録」として保存されているのが特徴です。また、収集されたデータは英国図書館や英国図書館分館、スコットランド国立図書館、ウェールズ国立図書館の4館に分散して保存されているため、万が一、いずれかの図書館で保存しているデータが破損・消失したとしても、他の図書館のデータから補填される仕組みとなっています。

公式サイト:https://www.webarchive.org.uk

6.ウェブ魚拓(日本)

「ウェブ魚拓」は、株式会社アフィリティーが運営するWebページを保存してくれるサービスです。前述したWayback Machineとの大きな違いは、自動保存ではなく「ユーザー自らが保存したいWebサイトのURLを入力する」点です。URLを入力後、過去に同じサイトが保存されていないかのチェックが行われ、重複がない場合に保存されます。

公式サイト:https://megalodon.jp

まとめ

本稿ではインターネットアーカイブや過去のサイトを確認する方法について紹介しました。Webアーカイブサービスは複数ありますが、どのサービスも無料で利用できます。Webアーカイブサービスを上手にSEO対策に活用して、より良いWebサイト構築を目指しましょう。

成果に直結する、オウンドメディア立ち上げサービス