据可靠资料显示,Google正在着手处理互联网上的垃圾信息。
据Slashdot新闻论坛的网友们称,从这个星期开始,用Google搜索引擎搜索如speaker bracelet或者candle
truck等古怪的词组时,获得的搜索结果非常少,甚至连一个期待会得到的相关结果都没有。
据剑桥大学的计算机程序员兼互联网信息过滤系统专家Seth
Finkelstein透露,他已经找到原因了。在上周五,Finkelstein称:“Google搜索引擎的搜索结果过于繁多,这很可能是由搜索引擎中有关垃圾信息过滤运算法的一个漏洞导致的。”网络垃圾信息制造者花费了大量的时间,通过使用虚假的网页或链接去增强其垃圾信息的浏览量,最终使其网页占据了Google搜索结果的最前列。有鉴于此,Google的工程师们正想办法去清除这些垃圾信息,确保用户得到的是有价值的搜索结果。
Finkelstein将其关于这个问题的理论研究放到了自己的个人主页上(www.sethf.com),该主页还包括了一个明显地发布垃圾信息网页的链接。奇怪的是该网页只是一列看似是由非常多的词组组成的无序排列(如rugs,
home mortgage loan, 1966 chevrolet corvette),并通过更多的词组链接到更多的网页。
Finkelstein透露,Google搜索引擎的一个漏洞导致了上述情况的发生。只要Google找到某些相关的字眼,它就会将其“一网打尽”。
Google的发言人Nathan Tyler承认,上星期公司已经找到了该漏洞,但他拒绝透露更详细的情况。
那么,到底是些什么用户在搜索诸如“speaker bracelets”或“candle truck”这类词组呢?答案是由那些只在google主页(www.googlewhack.com)进行搜索的爱好者们(GoogleWhackers)发现的。最近,包括fetishized
armadillo和panfish interrogation在内的,能在Google搜索到的词组可能已经不少了。
|