雅虎搜索是怎样工作的? |
|
http://www.sowang.com 2006年7月17日 |
|
|
|
搜集资料 首先搜索引擎会建立一个网页地图(Webmap),再使用网页抓取程序(Robot)根据网页地图来抓取(Crawl)网页,储存到搜索数据库中。 接下来会利用索引技术(Index)将数据做编号储存,同时搜索技术也会利用一些相关技术将不好的网站(Spam)去除。
将搜索结果进行排序 当使用者输入一个搜索词查询时,搜索引擎会用这个搜索词到搜索数据库中比对,并且经过一些相关度的运算之后,依照相关程度将网页做排序,相关度高的排在前面。 相关度的运算,除了判别网站名称或叙述内容中有符合搜索词的搜索结果,运算程序还会根据该网页被连结的次数等相关分数来计算,相关程度的高低是由搜索引擎程序运算,根据各种因素复合计算出来,并非绝对的单一因素。 更新网页数据 网页数据库每天都会进行部分数据的更新,由于数据库庞大,所有数据完全更新大约需要2到3个月的时间。 |
|
|
|
|
Copyright ©
SoWang.com.All
Rights Reserved |