|
||
搜索者容易犯的七个低级错误 |
||
|
||
搜索引擎9238
2001.4
1:停用词Sputtering on 'Stop Words' 一些搜索引擎会忽略这些词,当你把停用词输入搜索框时,不管网上有多少数量的相关文件,它们一个都不会找回来给你。 这些被叫做“停用词”(stop words),因为搜索引擎在它的数据库里碰到这些词时不会搜索。 如果你在一个搜索请求中使用了停用词,那么你得到大量毫不相关的搜索结果。比如,短语'searching the Web' 包含了两个停用词,'the' 和 'Web'。虽然这还不算特别常见的词汇,但Web 在网络上实在是太常见了,使它事实上不能帮你搜索到什么有用的内容。 如果去掉停用词,'searching the Web' 变成 'searching',这个关键词带给你的搜索结果会从搜索一个逃犯直到寻求启蒙。(quests for enlightenment)—如果你够幸运,当然也会得到一些关于“searching the Web”的搜索结果。 怎样辨别停用词呢?300个最常用的英文词汇基本上都是停用词,搜索引擎google在你的搜索关键词中含有停用词时,会把它忽略的每个停用词告诉你,就显示在搜索结果页最上边。你可以用一个含停用词 'web' 的关键词试一下。
布尔操作符,象and、or 和not,能够使你的搜索结果更精确——如果使用正确的话。 按《The Extreme Searcher's Guide to Web Search Engines》的作者Ran Hock的说法, 各种搜索引擎对布尔符都有自己的支持方法,并非完全相同。比如,同样一种效果,有的搜索引擎只要用'not',有的搜索引擎却要用'and not'才能达到。而且,有些搜索引擎要求布尔符必须是大写的,另一些就没有这种要求。 如果你真的想使用布尔符,请认真学习它的使用方法。
Vulgar来自拉丁语vulgus, 意思是普通。象一些有教养的诡辩家,搜索引擎对普通词的搜索存在缺陷。不是因为它们妄自尊大或自命不凡。而是因为这些词太常见了,以至于出现在成百万上千万的网页中,使得它们事实上不能被用来帮你找到什么有用的内容。 比如说“weather”,
有成千上万的网站提供跟“weather”相关的信息,从地方天气预报到学术论文到气象学,
要小心使用多义词。 Kris Carpenter是Excite
的搜索服务主管,举了'bond'
作为例子。我们不得不问自己,他们在找的信息是关于金融公债的、化学粘合剂的、还是大名鼎鼎的007邦德的? 搜索引擎也很容易被同拼法异音异义的词迷惑,比如 'lead' ,发音LEED的时候, 意思是领导,发音LED的时候指的是一种金属元素。 如果可以,尽可能使用意义明确的同义词代替同拼法异音异义的字。例子可以看The Heteronym Home Page.
搜索者的另一个问题是要不要在关键词中使用大写字母。 如果你在搜索关键词中使用大写字母,那么搜索引擎返回的结果将只有一种,其网页中含有大小写跟你的搜索关键词完全相同的单词。 象人名和地名之类关键词使用大写字母是个好选择,但是其它对大小写没那么敏感的单词,如果也使用大写字母,可能使你错过很多有用的网页。 如果想知道哪个搜索引擎对大写敏感,以及如何处理大小写字母,就对Danny Sullivan的网站“Search Engine Watch”上的Search Engines And Capitalization花点时间吧。
多数搜索引擎对于 'Kosovo refugees' 或 'space shuttle missions' 这样的短语搜索效果很好。然而,当你使用类似这一节的标题的短语“Close, But No Cigar”进行搜索时,就遇到问题了。 在一个主流搜索引擎中搜索'close but no cigar',得到的第二条结果是:The Common Cold: Relief But No Cure. Definitely no cigar! 两个关键词之间的距离称为接近程度。 当你的搜索关键词们分散在一个网页的不同位置时,有些搜索引擎会给你一个积极的结果,不管它们是否彼此靠近,还是位于同一个短语中。 如果你希望你用的搜索关键词们在搜索到的内容里互相靠近,那么你的最好选择是AltaVista 和Lycos, AltaVista 它允许你使用 NEAR 这个操作符号,而 Lycos 的高级搜索提供了多种设置关键词接近程度的可能。
7:在错误的地方搜索Searching for Hits in all
the Wrong Places 在你决定找某种内容之前,先确认你对这次搜索任务使用了正确的工具。各种搜索引擎在搜索范围、功能和质量方面大相径庭,如果没有为你的每次搜索分别选择正确的搜索工具,你将浪费自己大量的时间。 你应该使用Excite 还是HotBot? AltaVista 还是 InfoSpace? 分析你的需求,比较不同搜索引擎的强项和弱点,然后选择最适合这次搜索任务的搜索工具。 如果你真的遇到怎么也搜索不到,那也不要太过苛求自己。我所听过的最荒谬可笑的说法是:“你能在ingternet上找到任何东西”。这就象在说,你能在每一个煤矿里都找到钻石。 也许听上去有点异端邪说的味道,但是有个网络搜索指南确实说过,有时你能选择的最好搜索方法是放弃搜索,跑一趟附近的图书馆。图书馆里网上找不到的成吨的信息资源。而且图书馆员一般是受过训练的的专家,它们通常会很乐意帮你找东西。当你在网上无处可去的时候,试一下真正的“人工智能搜索引擎”吧,你会发现它们真的非常优秀 。
注意:以上文章4月中译自about,原文中错误与过时之处不在少数,未作纠正,仅供参考,切勿全信。
|
||
|
||