Google検索の限界

ちょっと乱暴な議論かもしれないが、Google検索の限界が見えてきた。
Googleに代表される従来の検索エンジンは、Webコンテンツのテキストを形態素解析またはN-gramによって断片化したキーワード・インデックスに対して、どういうレイティングをつけるか?という味付けの妙だったといえる。
【参考】検索エンジンの仕組み > Ngram(N-gram)とは何か & 形態素解析との比較

このGoogle的Web検索の限界が二つの方向から見えてきた。

◎セマンティック検索
ひとつは"Semantic Search"。意味解析エンジンによって付与されたメタ情報をインデックスとして、その関連性によってレイティングされるもの。自然文解析エンジンやレコメンデーション・エンジンと呼ばれるものも、こうした分野にマッピングされるもののひとつといえるだろう。
【参考】Computerworld - エンタープライズITの総合ニュースサイト

Powerset is a search engine that focuses on natural language processing. In other words, Powerset will not search based simply on keywords alone, but will try to understand the search phrase as a whole. The goal of the product is to make searching more “natural and intuitive.”

Powerset launched a limited showcase version of its site to the public in May 2008.

Powerset was acquired by Microsoft on 1st July 2008.

Powerset | CrunchBase Profile

FAST develops enterprise search technologies and solutions that are behind the scenes at the world’s best known companies with the most demanding search problems.
FAST was acquired by Microsoft on Jan 2008.

Fast Search & Transfer | CrunchBase Profile


"Sun Microsystems"で検索したときに、買収話で話題の"IBM"関連が上位表示されているところがポイント。

The Financial Times Group, which is owned by the British publisher Pearson, is not exactly the place you’d expect to find the latest search engine. But a startup deep within the bowels of the organization called FT Search is launching one at 8PM ET tonight called Newssift. It is a semantic search engine that sifts through business news, and it is not half bad, especially for bigger companies and broader topics.

The Financial Times Launches Its Own Business News Search Engine (Newssift). | TechCrunch

◎リアルタイム検索
もうひとつは"Twitter Search"。リアルタイム性に飛んだコンテンツをクローリング対象とした検索は、従来Googleが苦手としてきたもので、Blog検索などはあるものの、そもそも時系列の概念がGoogleの場合は薄い。その死角を埋める(つもりは当初無かったと思うが)ものとして、"Twitter Search"は機能し始めている。とにかくタイムスタンプのみをキーとして羅列されるTwitterのフロー・コンテンツは、Google PageRankのプライオリティ付けされたコンテンツとは対極にある。

私はTwitterをマイクロ・ブログ・サービスだと考えていると説明した。膨大な感情―苦情などがそこに吐き出されている。これは、すごいことだ。しかもTwitterが獲得したユーザーベースはすでにクリティカルマス〔臨界点〕を超えている。世界中でなにか事件が起きていたら、必ずTwitterから情報が得られるのだ。

<中略>

そして、すべての情報はTwitterが昨年夏に買収した検索エンジン、search.twitter.comで収集できるのだ。

Twitterについてはそろそろ検索エンジンとして考えるべきだ


"Gfail"と検索すると、Gmailがまたダウンしているぞ、という呟きが世界中から寄せられていることがわかる。