中文搜索引擎指南网

 找回密码
 禁止注册

QQ登录

只需一步,快速开始

搜索
查看: 8849|回复: 0
打印 上一主题 下一主题

财富杂志:垃圾信息太多阻碍实时搜索

[复制链接]
跳转到指定楼层
1#
发表于 2009-7-2 10:49:48 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
腾讯科技讯 北京时间7月2日消息,美国知名财经杂志《财富》网络版周三刊文称,不少美国搜索引擎服务商已在大力开发实时(real-time)搜索服务,以满足Twitter、Flickr及其他博客网站用户的特定搜索需求;但实时搜索要真正满足用户实际需要,各搜索引擎开发商仍有很长的道路要走。

实时搜索

对于全球各地发生的重大事件,美国微型博客网站Twitter正扮演起及时发布最新消息的角色。Twitter用户发布的内容包括简短消息、图片和视频(对于较长内容,则发布相应内容的链接)等等。由于这些内容会不断持续更新,不少用户需要在这些海量信息中快速搜索到自己希望查看的信息。这就是所谓的实时搜索。

然而实时搜索目前面临的最大问题是:面对连续不断更新的各类实时信息,搜索引擎很难从中筛选出可靠、有实际价值的信息,并将那些虚假、垃圾信息排除在外。

事实上,无论是Twitter、Facebook,还是Flickr及其他博客网站,都面临着实时信息过多、过乱的挑战。由于这些平台允许用户自行发布各种内容,导致真正重要的信息很快会淹没在大量毫无价值的垃圾信息当中。

市场前景

即使是谷歌这样的搜索巨头,也不敢说自己已经解决了实时搜索问题。在谷歌今年5月举行的时代精神(Zeitgeist)技术大会上,谷歌联合创始人拉里·佩奇(Larry Page)承认,在实时搜索业务领域,谷歌仍没有开发出多少真正有实用价值的产品和服务。由于Twitter已推出自家搜索服务,佩奇承认,谷歌实时搜索业务已落后于Twitter。

在看到实时搜索的巨大市场增长潜力后,美国多家科技创业公司已杀入该业务领域,其中包括Collecta、OneRiot和Scoopler等。这些创业公司都想解决一个业界难题:如何让网民迅速了解到目前互联网最为热门的事件和话题是什么?毕竟几乎每周内,互联网都会出现最新热门话题。

美国知名市场研究公司IDC分析师哈德利·雷诺兹(Hadley Reynolds)对此表示:“在如何提供良好的实时搜索解决方案事宜上,微软和雅虎还得花上一段时间。如此一来,那些主要从事搜索引擎开发的创业公司就能抓住该商机。”

技术难题

然而要真正解决实时搜索难题并非易事。在实时搜索业务领域,搜索引擎一方面要提供最近、最为流行的信息;而另一方面,用户会从自己主观意愿出发,认为其他一些事件最为重要。如此一来,流行话题同主观意愿的冲突将日渐明显,而搜索引擎服务商却无法就此拿出一套十全十美的解决方案。

在实时搜索信息的筛选方式上,最为简单的办法就让时间来作出选择。但如果搜索引擎以内容提供者权威性、内容传播范围等标准作为筛选方式,则搜索引擎很可能会错过一些非常有价值的信息——尽管这些信息最初并没有受到外界关注。

在Twitter为例,该网站每天都会发布大量信息更新。去年期间,Twitter推出了名为Summize的搜索服务,其信息筛选方式就是以时间为标准。前不久刚刚上线的Collecta,也是以时间作为信息筛选标准,但同时会关注其他博客和社交网站的相关信息发布情况。

任重道远

但仅仅以时间为标准,未必算得上是实时搜索中的最佳筛选方式。Scoopler等搜索引擎创业公司已在开发一种新的算法:不仅仅抓取最近发布的信息,而且会抓取那些最为热门的信息。如OneRiot就开发出了一款名为PulseRank的产品,它能追踪所发布实时信息的“新鲜程度”、信息提交者的权威性以及该信息的传播范围。

然而截止目前,上述新型实时搜索引擎都没有进入主流应用阶段。究其原因,一方面是这些搜索引擎的用户界面易用性较差;二是相应搜索结果没有多大实际价值。

举例来说,前两天美国纳斯达克证交所前任主席伯纳德·马多夫(Bernard Madoff)被判入狱150年的消息传开后,用户在上述实时搜索引擎在键入马多夫的关键词后,却没有找到其入狱150年新闻,而是时间更早的“旧闻”。由此看来,实时搜索引擎要真正满足用户需求,仍有很长的道路要走。(编译/中涛)
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏

Archiver|手机版|小黑屋|教你搜 ( 鲁ICP备16006309号

GMT+8, 2024-10-1 10:30 , Processed in 0.219626 second(s), 21 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表