【参考】検索エンジンの仕組み > Ngram(N-gram)とは何か & 形態素解析との比較


ひとつは"Semantic Search"。意味解析エンジンによって付与されたメタ情報をインデックスとして、その関連性によってレイティングされるもの。自然文解析エンジンやレコメンデーション・エンジンと呼ばれるものも、こうした分野にマッピングされるもののひとつといえるだろう。
【参考】Computerworld - エンタープライズITの総合ニュースサイト

Powerset is a search engine that focuses on natural language processing. In other words, Powerset will not search based simply on keywords alone, but will try to understand the search phrase as a whole. The goal of the product is to make searching more “natural and intuitive.”

Powerset launched a limited showcase version of its site to the public in May 2008.

Powerset was acquired by Microsoft on 1st July 2008.

Powerset | CrunchBase Profile

FAST develops enterprise search technologies and solutions that are behind the scenes at the world’s best known companies with the most demanding search problems.
FAST was acquired by Microsoft on Jan 2008.

Fast Search & Transfer | CrunchBase Profile

"Sun Microsystems"で検索したときに、買収話で話題の"IBM"関連が上位表示されているところがポイント。

The Financial Times Group, which is owned by the British publisher Pearson, is not exactly the place you’d expect to find the latest search engine. But a startup deep within the bowels of the organization called FT Search is launching one at 8PM ET tonight called Newssift. It is a semantic search engine that sifts through business news, and it is not half bad, especially for bigger companies and broader topics.

The Financial Times Launches Its Own Business News Search Engine (Newssift). | TechCrunch

もうひとつは"Twitter Search"。リアルタイム性に飛んだコンテンツをクローリング対象とした検索は、従来Googleが苦手としてきたもので、Blog検索などはあるものの、そもそも時系列の概念がGoogleの場合は薄い。その死角を埋める(つもりは当初無かったと思うが)ものとして、"Twitter Search"は機能し始めている。とにかくタイムスタンプのみをキーとして羅列されるTwitterのフロー・コンテンツは、Google PageRankのプライオリティ付けされたコンテンツとは対極にある。