Google 検索の3つの仕組み

WEBマーケティング

ホームページを作成しても上位検索されないと嘆く方は多いと思います。

多くの人は Yahooもしくは、google にて検索をしております。 しかも、Yahooの検索エンジン(プログラム)は、Google検索エンジン(プログラム)を使用しております。

ということは、検索のほとんどがgoogleを使っていることになります。googleの独占になっているのが現状です。

ということで、長いものにはまかれた方が得策かと思います。(笑)

Google 検索の仕組み

ウェブ検索は、大型書籍を参照するようなものと表現しております。Googleは、クロール、インデックス、検索結果の表示という3つのプロセスがあるということです。

引用:

ウェブ検索は、あらゆる情報の場所を正確に記述した優れた索引を備えた大型書籍を参照するようなものです。Google 検索を実行するときは、Google のプログラムで Google のインデックスを確認し、最も関連性の高い検索結果を特定して表示(提供)します。

検索結果の表示は主に次の 3 つのプロセスに分けられます:

  • クロール: Google がサイトを認識して検出する
  • インデックス作成: Google がサイトのインデックスを作成する
  • 検索結果の表示: ユーザーの検索と関連性の高い有益なコンテンツが含まれているサイトを表示する

ホームページ等を作成してから検索順位が決まるまで

クロール:googleがあなたのサイトを見つける。

インデックス:googleがあなたのサイトをインデックス(見出し)に登録する。

検索結果の表示:googleがあなたのサイトをインデックス(見出し)から検索順位を決めた結果を表示させる。

といった流れとなります。

1.クロール

引用

クロールは、Googlebot が Google のインデックスに追加する、新しいページや更新されたページを検出するプロセスです。

Google では、大規模なコンピュータ群を使用して、ウェブ上の数十億のページを取得(クロール)します。取得プログラムは Googlebot と呼ばれ、ロボットやスパイダーとも呼ばれます。Googlebot はアルゴリズム化されたプロセスを使用します。クロールを実行するサイト、クロールの頻度、各サイトから取得するページ数はコンピュータ プログラムによって決定されます。

クロールを開始する際は、前回のクロールで生成され、ウェブマスターから提供されたサイトマップによって補強された、ウェブページの URL リストを使用します。Googlebot はこれらのウェブサイトすべてにアクセスし、各ページのリンクを検出してクロール対象ページのリストに追加します。また、新しいサイト、既存のサイトへの変更、無効なリンクを検出し、Google インデックスの更新情報として使用します。

Google では、有料でサイトのクロール頻度を増やすことは行っていません。収益を得る AdWords サービスと検索サービスは区別して対応しています。

Googlebot(ロボット)がサイトを巡回してWEB上の全てのページを集めようとしてます。Googlebot(ロボット)がサイトに巡回してきたときに、検索エンジンは初めてサイトの存在を知ります。サイトやホームページを作ったら、まずはGooglebot(ロボット)に見つけてもらうということがSEOの第一歩となります。

 

2.インデックス作成

引用:

Googlebot はクロールした各ページを処理し、検出したすべての単語とページ上の場所を登録した大規模なインデックスを作成します。さらに、タイトルタグや alt 属性などの主要なコンテンツ タグや属性に含まれる情報も処理します。Googlebot ではさまざまなコンテンツを処理できますが、すべての種類を処理できるわけではありません。たとえば、一部のリッチ メディア ファイルや動的ページのコンテンツは処理できません。

Googlebot は、URLを辿って他のページに遷移します。そのページでGooglebotは、新たにインデックスをしていくのです。

インデックスは、画像や動画などのコンテンツは処理ができないということです。Googlebotというプログラムは、画像に何が書かれているのか?どんな動画を再生しているのか?は理解できていないのです。

3.検索結果の表示

引用:

ユーザーがクエリを入力すると、インデックスで一致するページが検索され、関連性が高いと判断された検索結果が返されます。特定のページの関連性は、PageRank など 200 を超える要素によって決まります。PageRank はページの重要性を示すもので、他のページからの参照リンクに基づいて決まります。つまり、別のサイトからの個々のリンクがサイトの PageRank に寄与するということです。リンクはすべて同等に扱われるわけではありません。Google では、不正なリンクや検索結果に悪影響を及ぼす行為を特定して、ユーザーの利便性を向上させるよう努めています。コンテンツの品質に基づいて作成されるリンクが最も重視されます。

検索結果ページでサイトが上位に表示されるようにするには、Google でサイトを正しくクロールし、インデックスに登録できるようにする必要があります。よくある問題を回避してサイトのランキングを上げるベスト プラクティスについては、ウェブマスター向けガイドライン(品質に関するガイドライン)をご覧ください。

Google の「もしかして」、「オートコンプリート」は、関連する検索語句、よくあるスペル間違いの修正候補、よく検索される語句を表示することによって、ユーザーの時間を節約する機能です。google.co.jp の検索結果と同様に、これらの機能で使用されるキーワードは、Google のウェブ クローラと検索アルゴリズムによって自動生成されます。これらの機能による予測の結果が表示されるのは、ユーザーの時間を節約できると考えられる場合のみです。Google の検索アルゴリズムでサイトのコンテンツがクエリに密接に関連していると判断されると、そのクエリに対し、サイトが上位にランクされます。

検索結果については、200以上のチェック項目とそれぞに点数がついているかと思います。それによって検索の順位が変わってくるようです。コンテンツの品質に基づいて作成されるリンクが最も重視されていることもチェックポイントかと思います。

マトメ

検索順位を決めるクロール、インデックス、検索結果の表示の3つの項目をしっかり考えて対策とるということがGoogle 検索の仕組みに準拠し、検索順位が上位に表示されていくということです。

タイトルとURLをコピーしました