
第44回 Google ウォッチング-3
![]() |
[プロフィール] お がわ・ひろし●1996年、デル、ゲートウェイの代理店としてマレーシアにて日系企業及び在住邦人向けのPC通販ベンチャーを創業するなど、アントレプレ ナーとして活躍。その後日立製作所を経てサイボウズにジョイン。feedpathの基本設計を考案し、フィードパス株式会社のCOOに就任するが、 2007年12月に退任。現在は㈱サンブリッジにて起業準備中。ブロガーとしてSpeed Feed、「Web2.0BOOK」「ビジネスブログブック」シリーズなどの著作がある。 |
世界中を駆け回るGoogleのクローラー
検索エンジンは、この連載でも何度か説明している通り、Web上の更新情報を探しまわり、差分をかき集めてくるクローラーと、それらの情報を整理するインデクサー、そしてキーワードに対して検索結果を正しく返すサーチエンジンの3つの要素を持っています。
検索エンジンの優劣は、従って、如何に早く多くの情報を集めてくるか、そして正確な情報を返すか、ということになります。いくらサーチエンジンそのものが優秀でも、情報量が少なければなんにもならないのです。
つまり、クローラーはGoogleの全てのサービスを支える重要な役割を担っていると言えるでしょう。このクローラーは、Web上を自在に走り回り、あらゆる情報を収集してくるものではありますが、実は、検索される側のサーバーの持ち主は、情報を提供することを拒むことができます。Googleはクローラーポリシーと呼ばれる規約のなかで、自らこの方法について明示しています。つまり、検索対象としての情報を集めるクローラー側と、集められるサーバー側での、暗黙の了解があって初めて、GoogleのクローラーはWebの情報を集めてくることができるのです。
無敵のGoogleですが、実は韓国ではほとんどシェアを撮ることができません。この理由は、韓国のISPやポータルは、他社の検索エンジンのクローラーのアクセスを拒否する傾向にあり、従ってGoogleでさえも韓国国内の情報を十分に検索させることができないということになります。自社コンテンツを持たないGoogleでは、これは致命的です。
つまり、Googleを、世界中が一斉に拒否して、彼らのクローラーの侵入を許さなければ、それでGoogleのデーダベースやインデクスサーバーは枯渇し、彼らは死滅するのです。要するに、Googleでさえも、他者依存して生きている、ということです。
クリエイティブコモンズの考え方
例えばトラックバックにしても、従来のサイト同士であれば相互リンクといって、リンクをつけることにいちいち相手の許可を得ようとしたものです。しかし、トラックバックはシステムとして、スパムでもない限り、自分のBlogへのリンクをつけることを自動的に許可する、という考え方のもとに作られたシステムです。
あるいは、マッシュアップは、自社サイトのデータソースへのアクセスを原則として許すことから始まります。この草分けがGoogle Mapsですが、
共有されることによって、互いの利便を図る、そしてその結果として自分たちの事業を拡大する、というシンプルかつ公正な考え方が、Web2.0的と言えるでしょう。
逆にいうと、Web上で、例えばWikipediaのように無料でありとあらゆる情報を開示していく、共有していくということになると、どこからどこまでが引用で、無断転載をどこまで許していくか、などという線引きが重要になります。しかし、過度な著作権や所有権の主張は共有の速度や、引用によってさらに付加価値がついていく、知的向上を妨げる可能性があります。また、Googleだけが唯一の検索エンジンとなることは望ましくはないですが、韓国のように、汎用的な検索エンジンが生まれづらい環境は必ずしもよいこととは思いません。
この線引きを、インターネットの理念に基づいて解決していこうという動きがクリエイティブコモンズです。

クリエイティブコモンズの考え方





