|
||
当——搜索引擎令你失望时 |
||
|
||
搜索引擎9238
2001.4
1:找到 8,700,000
相关网页:找到几十万几百万的过多网页 最常见的搜索失败,象上边这个例子,搜索引擎没有帮你找到草堆中的那根针,而是给了你整个草堆。通常,这种搜索失败有两个原因,这两个原因其实都很容易解决。
搜索请求中的常见短语(Common words)词通常是一个多单词的短语,含有三到四个在句子中常见的单词。只要可能,尽量使用常见词的同义词。更好的方法是,想出不常用的甚至是罕见词来描述你的主题。这里的诀窍是不要把自己想得太聪明,不要使用不会被大多数网络写作者使用的关键词。
如果你必须使用某个常见词,那么使用
(加号)和-(减号)来缩小你的搜索范围。比如:'
George Washington -state -D.C. -university'
会主要找出关于George Washington这个人的网页,不会被淹没在大量跟
Washington state、 Washington D.C. 和 George Washington
University有关的网页中。 这简单的小符号能够帮你去除成千上百万的无关网页。
If you have typed the address
(URL), do check the spelling! 虽然这种情况不算多,但搜索引擎有时确实不能按你的搜索要求找到任何内容。有时出现这种问题仅仅是因为网上还没有你要找的内容。当你找一个人,找一个没名气的小公司,或者找非常深奥冷僻的论据时就有可能遇到这种情况。 这种失败多半是因为你找错了地方。找人,就不要用普通搜索引擎,用专业的寻人工具会更有效。找公司,应该用Transium
或 Kompass
这样的黄页工具。找深奥冷僻的论据,为什么不试一试Ask
Jeeves 或其它的专业参考服务呢? 你要知道主要搜索引擎收集的网站在数量和范围上都有很大的差异。Yahoo
(一百多万) 和 Webcrawler (二百多万)如果跟AltaVista,
HotBot, 和Northern Light数以亿计的数量相比真是小儿科了。 如果你要找的内容必须用普通搜索引擎来搜索,那么使用元搜索引擎吧,象Dogpile, Mamma, 或Savvy Search。
网管犯的最愚蠢的错误之一,但也是相当常见的错误是:象整理自己的硬盘一样整理网站,把所有混乱的文件起上规范的名字,然后搬到整整齐齐结构清晰的文件夹中。 当文件被移动或重新命名后,收藏这个文件的每一个书签,搜索引擎指向这个文件的每一个链接,以及指向这个文件的每一个被发表的链接,
就都作废了。这种欠考虑的“整理”在网络上制造了远比计算机失灵更多的混乱。如果我是因特网的总管,一定会把修改url定为非法,哪怕一个网站会多么的混乱。 OK,
牢骚就发到这里。但是,当遇到这种情况时,你能做什么? 有个好消息可以告诉你, '404' 或者
'document not found'
这种信息是由那个曾经的网页呆过的服务器发出的,就是说该服务器还在那里, 你所要做的只是一点小小的侦察工作,找到那个网页在该服务器上的新位置。 使用一种叫做'URL back-up'
的方法,把你的指针移到地址栏里'htm' 或 'html'
的后边,然后往前删除文件名,在碰到第一个斜杠后停止,然后打回车键。重复此动作,
直到你找到含有指向你找的文件的链接的菜单,或者到根目录为止。根目录上应该有链接或搜索框能帮你找到所需文件。 多数情况下,只要文件还在原来那个服务器上,你在原来位置的附近小小的转一圈就能找到它。更大的问题是文件从原始服务器上彻底消失了。
4:网站已搬走;转向地址未知
搜索到的网站已搬走,地址未知 网站就象人,有时会被迫迁移。学生毕业了;网页从免费社区搬到有独立域名的大网站了;人们改变ISP了。 field搜索是大多数搜索引擎支持的高级功能。 如果你搜索文件的作者,那么使用 HotBot的'the person' 搜索选项。搜索人的时候,记得名字首字母要大写,整个姓名用双引号括起来。
你做了所有努力,可是,上星期还带给你很好搜索结果的搜索请求,这次无论你怎么努力,都只搜索到一堆无用的结果,你想要找的网页已经不见了。发生了什么事? 有关搜索引擎的一个肮脏的小秘密是:搜索引擎永不停息的从它们的索引库中抛弃已索引的网页。有时是成千上万的网页。有时这些被遗弃的网页会重新出现在索引库中,有时不会。 正式的解释从精选索引数据库、保持索引内容的新鲜和相关度、到维护改造临时数据库都有。all and well,否则你在寻找的文件永远不会再出现在索引库里。 幸运的是,有两个地方可以让你找到需要的网页。Google 对它索引的的所有网页准备了一份'cache'。即使你要找的网页链接已经连不上了,你也可以点击该网页的“cache”,然后你会得到google上次索引该网页时准备的备份。
这种方法有不利的一面,Google的cache和Alexa的archive都可能是过期的内容。当然,在大多数情况下,有点东西总比什么都没有强。
注意:以上文章4月中译自about,原文中错误与过时之处不在少数,未作纠正,仅供参考,切勿全信。
|
||
|
||