Googleの新検索アーキテクチャ「Caffeine」
Googleの新検索アーキテクチャ「Caffeine」
2011年11月07日TEXT:小川 浩(株式会社モディファイ CEO 兼クリエイティブディレクター)
検索という技術を説明することは簡単だ。
1. Web上の更新情報を収集する高速&大規模クローラ技術
2. 収集データを検索しやすい構造に整理し、リスト化するインデックス技術
3. Webデータの重要性や信頼性を計算するフィルタリング
4. 利用者の検索キーワード(クエリ)に関連する最適な検索結果を返すアルゴリズム
表現の違いこそあれ、検索エンジンはおおむねこうした構造をもつ。Googleが世界を制したのは、従前の競合他社が少数の強力な高性能サーバによる中央集中型クローリング技術を磨いたことに対して、Googleは安価のサーバを大量に置き、分散型クローリング技術の確立を目指したこと。および検索結果の表示順を、他社がWebページ内のテキストとのマッチングを重要視したのに対して、Googleは該当するWebページの被リンク率など、ほかのWebサイトのオーナーから寄せられた「評判」を重視したことなどのイノベーションによるものだ。
つまりGoogleが世界最強クラスのネット企業でいられる理由は、このクローリング技術と検索アルゴリズムによる。
今回、GoogleはCaffeine(カフェイン)と呼ばれる新しい検索アーキテクチャを正式に採用しはじめた。Caffeineは2008年頃から次世代アーキテクチャとしてGoogleがメディアに情報をリークしていたものだ。
このCaffeineは、ソーシャルメディア全盛時代にあって、検索結果をよりリアルタイムに近づけている意図がある。いわば情報を収集したあとに、その情報の重要性や信頼性に加えて“鮮度”すなわち即時性の要素を加えながら、クエリとの関連を決めていくものだ。
Twitterのリアルタイム検索は単なる更新順であり、その情報がクエリに対して最適かどうかの判断はない。単にそのクエリのテキストがTwitter上にアップされたツイートの中にヒットするかどうか、そしてヒットした時間順に並べられているだけである。もちろん、それで役立つこともあるが、SN比(必要な情報と雑音に比率)についての配慮はない。Googleからすれば、それは検索とはいえない代物だ。だからこそ、GoogleはCaffeineを採用することでリアルタイム検索と従来のアルゴリズム検索のハイブリッドを実現しようとしているのだ。
【お知らせ】MdN Design Interactiveのコラムも読める無料iPhoneアプリ「MdN News Reader」を公開しました、ぜひご利用ください。
MdN News Reader
URL:http://www.mdn.co.jp/di/newstopics/17571/
■著者の最近の記事
Siriが切り開くユーザーインターフェイスの未来
隠れた世界的起業家、ジャック・ドーシーの功績
iPhone/iPad最大の弱点を打ち消すiCloud
スティーブ・ジョブズが遺した偉大なる遺産
ユーザーの“慣れ”を巧みに利用したFacebookの新機能
FacebookタイムラインがSNS業界に与える影響
ソーシャルメディア発展のキーとなるLBS
[筆者プロフィール]
おがわ・ひろし●株式会社モディファイ CEO兼クリエイティブディレクター。著書に『ビジネスブログブック』シリーズ(毎日コミュニケーションズ)、『Web2.0BOOK』(インプレス)、『仕事で使える!「Twitter」超入門』(青春出版社)、『ソーシャルメディアマーケティング』(ソフトバンククリエイティブ/共著)などがある。
twitter:http://www.twitter.com/ogawakazuhiro
facebook:http://www.facebook.com/ogawakazuhiro