オープンソースな検索エンジンの意味は?
Posted on | 7月 30, 2007 | No Comments
検索エンジンって既にインフラと化していて、正直googleがなくなったらwebが使えなくなるんではないかと思う今日この頃。Yahoo,MSNはごくたまにしか使っていないのだが。wikiaがOpen Sourceのものを提供開始したらしい。
- J・ウェールズ氏、オープンソースのウェブクローラ「Grub」のテスト版を発表:ニュース – CNET Japan
- Nutch: Nutchについて (別なオープンソースの検索エンジン)
- etc
Grubはクライアントと協調して検索インデックスを集めるタイプ。商業ベースのwikiサービスWikiaが獲得し運用を開始する模様である。ソースがオープンでも検索エンジン自体はおそらく広告ベースで運用するだろうから、結局ユーザの力を借りてgoogleを作ろうという考えか。
Nutchは通常の検索エンジンと似た感じのものらしい。クロールしてページを集めてくるようなもの。正直10億ページ/月のクロールなど個人では設置不可能。膨大なネットワークリソースが必要そうなので、オープンソースであっても自前で設置できないのでは面白みにかける。個人設置の検索エンジンは今までいくつか見たがいずれも検索結果が今ひとつである。
Grubの考えは面白い。各ユーザのPCにクライアントをインストールしてSETI@HOMEのように分散して検索エンジンを作ろうという考え。大量のコンピューティングパワーを容易に獲得できるだろう。ユーザ数が増えれば増えるほど正確さ公正さが上がっていくはずである。やってるかどうかはわからないのだが、ページのランク付けを実際のユーザのアクティビティとあわせることが出来れば使えば使うほど正確な検索結果が出るような検索エンジンが出来るかもしれない。プライバシーとの兼ね合いが難しそうだが。
個人的にPC内よりサーバ設置タイプのP2Pな検索エンジンなんていうのがあれば面白いのではと思っているのだが。実現出来れば少なめに見て1サイト辺り1万ページ/日として30万ページ/月。10000サイトあれば30億ページ/月になる。結構いける数字ではないだろうか?お互いにデータを定期的に交換しあって自動的にインデックスを分散できたりしたら楽しそうだ。サーバ設置なのは常時接続しておけるから、余剰帯域とCPUを使えるかもしれないという考え。
と思ったらこんなのがYaCy: P2P Web Search Engine 。
まあそれはそれとして、 現状私は検索はほぼGoogleを使っていて結果にはそこそこ満足している。業者(Google/Yahoo/MSN等)によるバイアスは否定できないし、SEOなどの検索結果を操作する試みも盛んに行われている。余り影響があるようならありがたくないものだが、複数のエンジンがあることで有る程度の公正さは確保できるのではないかとおもっている。
今やwebのサービスの多くは広告収入ベースで運用されていて、TVなどと同じく無料サービスであることが普及する大きな要因だ。これを否定すれば、今後の発展は正直考えにくくなる。真にオープンにすることで広告もないような無料化を考えるなら別なビジネスモデルが必要となってくるが、直接ユーザからお金を徴収することは今のところ難しそうである。広告モデルでさえ全てのサービス会社がうまく回せているわけではないのに、結構難しそうである。
オープンなムーブメントは流れが出来れば(Linux/Wikipediaのように)非常にパワーがある。Microsoftほどの大企業ですら将来的には敗北してしまうかもしれない。ただしインフラ化するものについては余り多くの選択肢や指標があってもややこしいし、wikia/grubがオープンで公正を売りにするなら、独立性を保ったまま運営してもらい、むしろ競合ではなく、既存の検索エンジン(Googleなど)を補完するものとして機能(マッシュアップ?)すれば面白いかもしれない。
Comments
Leave a Reply