Google并不是第一个尝试用关键词搜索的公司,在它之前已有AltaVista、Infoseek、Inktomi等搜索引擎公司。而在企业用搜索中已广泛采用关键词搜索的方式,此类公司有Verity、中国的TRS等,这类企业级的搜索系统被称为全文检索系统(Full text search)。而在互联网进行这种全文搜索时,搜索技术遇到了强大的挑战,因为在数以亿计的网页中进行搜索,常常会出现上万甚至上千万的搜索结果,它们杂乱无章的出现在用户面前,而用户几乎没有能力从中挑选出自己真正需要的内容。在企业里成功应用的全文检索技术在互联网上变得没有价值。有人说搜索引擎会死去,但Google改变了一切。1998年Google发明了著名的PageRank技术,这是一种根据网页的链接关系决定网页重要程度的算法,这种算法的发明能够帮助Google从成千上万的结果中找到更接近用户的结果,于是人们能够从搜索结果的前几页中找到需要的内容。类似PageRank的超链分析技术成了第二代搜索引擎的关键技术之一。
2003年8月20日,我在“搜索的智慧”的新闻发布会上正式提出了第三代搜索引擎的概念。2004年8月搜狐提出了第三代互动搜索;2004年12月,中搜推出网络猪3.0,称其为第三代搜索引擎、个性化信息门户,网络猪也因Personal Information Gateway(个人信息门户)缩写后变为PIG而得名;2005年9月,美国政府提出研制第三代搜索;2005年10月,微软也提出了第三代搜索引擎的构想。虽然第三代搜索还在探索之中,但雅虎的人工目录分类和Google的关键词搜索作为前两代搜索的代表和特征已成广泛共识。