中文搜索引擎指南网
标题:
从人的需求看搜索领域的现在和未来(转)
[打印本页]
作者:
sowang
时间:
2006-5-1 15:17
标题:
从人的需求看搜索领域的现在和未来(转)
转自:
http://blog.csdn.net/xujun/
本文不讨论技术,只在此简单说说人的需求和搜索发展的关系。
近年来,随着互联网的迅猛发展,搜索这个简单功能慢慢发展成为一个产业。大多数人每天使用着例如google,百度,msn这样的搜索引擎寻找着信息。但是,与其说这些大家耳熟能详的网站公司是由技术推动着的,不如说其实人的需求才是技术前进的主动力。科学技术可以为我们带来新事物;但该新事物是否能得到普及和推广,得到大众的认可,关键的是其是否能满足人们的需求。
互联网的广泛运用,使得人们可以很方便的接触到大量的信息;可是接触并不代表自己本身能获得,由于人本身的获取能力、搜索能力和记忆能力的限制,大多数人面对如此多的信息,很难找到自己想获得的信息,同时还可能伴随着挫折感和焦虑感。这就是互联网信息爆炸和人类个体信息过载的问题。自然而然的,人们希望能迅速而有效的找到信息,搜索领域的发展正是适应了人的这种需求而产生的。
在此,我将分三个方面来说明搜索的发展。分别是
1、 搜索的内容方面
2、 向内(个人电脑)和向外(互联网)的交互结合方面
3、 搜索界面方面
需要明白的是,这三个方面都是紧紧围绕着“人们能够迅速而有效的找到信息”这个根本需求而出发的。迅速是指花费的时间短,有效是指找到自己想要的。
作者:
sowang
时间:
2006-5-1 15:17
一、搜索的内容方面
1994年成立的Yahoo是最早涉及此领域的。当时的互联网虽然规模比起现在小的多,但是已经发生了寻找信息困难的问题。Yahoo解决的办法是针对网站为单位,建立分门别类的类别,大类别里嵌套子类别。这种方法很好适应了当时互联网发展初期寻找信息的需求。1998年,国内的搜狐提供了相类似的搜索。
此乃发展的第一阶段。
但是发展总是不停止的,人的需求总是得满足的。第一阶段的搜索,现在从需求看来,至少有两点是存在问题的或者说是可以进一步提高的。第一,搜索的单位是网站,而不是具体的信息源;第二,寻找深层次的子类别将点击很多次,花的时间相应就长了。
1998年成立的google,把搜索带进了一个全新的阶段,也是将搜索从功能变成产业的头号功臣。(顺便说一句,google真正为人们熟知并广泛应用大致是在2003年左右,一则说明google此前能够潜心那么多年,是很多国内公司做不到的;二则google在1998年就可以看到或者预测到未来若干年的发展,的确显示了创始者对未来的深刻洞察力,这些都是我们值得学习的。)google的搜索是以文件为单位的,例如网页,各种各样得文档;搜索界面虽无创新,但却是简单实用的典范(这在第三方面会具体阐述);基于关键字的搜索。这个阶段的信息查找的时间和有效性方面都比第一阶段大大提高了。2000年,中国的百度提供了类似的服务。
此乃发展的第二阶段。
让我们回到原先提出的根本需求——迅速而有效的找到信息。Google和百度真能完美的解决这个问题吗。大家肯定是说“不”,幸好我也是这么想的。那么让仔细研究一下搜索过程包含的阶段。想象一下你搜索某个信息的全过程,1…2…3…OK。首先我们在脑海中出现要寻找的内容,这个内容是基于自然语言(就是你平时说的语言:中文,英文,法文,方言等等)的,然后你需要把基于自然语言的内容转化成若干关键字——这是第一个主要阶段;然后输入关键字,在搜索结果的界面寻找你真正想获得的信息——这是第二个主要阶段。举个具体的例子:如果我想去西藏自助旅游,我想知道详细的信息;我就先提取出关键字:西藏、旅游、自助;然后输入,在海量的结果中,寻找出对自己来说是有用的信息。
这两个阶段都存在着不少可以继续深入的方面。第一阶段,关键字毕竟不同于自然语言,意味着关键字不能包含所有的想表达的语言。虽然你经过努力,可以想出接近于语言表达的关键字组合,但这并不代表于相等。还举上例,如果我想得到去西藏自助旅游的详细信息,我不能把“详细”作为关键字输入,“详细”在此是作为意义呈现的,而不是关键字。这是基于自然语言搜索和关键字搜索的区别之一:自然语言搜索是基于意义搜索的,而关键字搜索是基于符号的。而且从自然语言转换成关键字,也需要付出相应的认知代价。第二阶段,由于搜索结果数量众多,在结果中寻找出所想要的信息,还是困难重重;而且信息与信息之间是相互分离的,提供的结果之间没有信息之间的相互关系存在。
顺着这两条思路下去。我们可以找到不少搜索引擎新的发展方向。比较简单的改进——我称之为第一阶段到第二阶段的过渡阶段。例如百度的分类搜索,对关键字进行不同分类的搜索——网页、图片、音乐等等,目的是为了简化搜索,使得结果集聚焦于某一个方面。
例如Vivísimo(
www.vivsimo.com
成立于1998年),它也对关键字进行了分类,让人更感兴趣的是,它能根据临时所得到的搜索结果来进行动态的归类工作(相当于在结果和结果之间建立联系)。它的搜索结果会非常有条理地在页面左边汇整出Categories再把全部结果展现在你面前,让你非常清楚自己所寻找的结果到底是哪个类别。Vivísimo是我最喜欢的搜索引擎,因为它还支持中文。
让我们来看看第三代的搜索引擎的发展阶段。从先前分析的两条思路出发,我们可以各自找到其中的代表之一。Lexxe (
www.lexxe.com
,2001年-2004年,现阶段还处于测试阶段)是一个基于自然语言的搜索引擎。lexxe引擎把用户打入文字当作语言来处理,而不是作为符号来处理。它的计算对象直接是语言,而不是一般符号,因为它具备了语言理解能力。Lexxe是一种很好的尝试,毕竟自然语言是语言学、心理学研究的难点之一。君不见微软、google等一批大公司投入巨大的人力、财力于此上面,就是为了满足人们即将产生的需求。Kartoo(
www.kartoo.com
,2001年)是第一个非线性搜索引擎,它能对搜索结果进行分类,并给出结果之间的联系,形成网络状的搜索结果。网络状的结构符合人类长时记忆的特点,当然能够使得人们更快、更好的找到所需的信息。
还有一个容易忽视的地方,就是搜索所包含的范围问题。什么意思呢?就是现在的搜索都是基于文字输入符号的方式进行搜索的。对于声音、图像等其他类型的符号,现阶段也只能根据其附属的文字符号信息来搜索。例如要寻找一首音乐,现在只能根据音乐的名称,而不能根据音乐的旋律来搜索。这方面被称之为多通道、跨通道的搜索,我估计这只在为数很少的实验室里有初级实验品产生。
(我把很多公司推出产品的年份都列了出来,细心的读者是否能根据自己的经验看出某些门道呢。)
作者:
sowang
时间:
2006-5-1 15:17
二、 向内(个人电脑)和向外(互联网)的交互结合方面
向外搜索即互联网搜索,在上面已说了很多。还有一个方向,就是向内搜索。早期的是微软资源管理器当中的搜索功能,找文件名,找文件中内容,诸如此类的。现今,google推出了桌面搜索工具,其运用的技术和互联网搜索的机制大致相当。这也说明了当电脑硬盘容量突破百G,人们的个人信息增多后,对自有信息的搜索也会发生各种问题。不过在此,我不讨论这点。在此,我要关注的是个人电脑和互联网交互结合方面,个人电脑和互联网现在是分离的两个部分,为什么不能把它们结合起来呢。我们在互联网上搜索的绝大部分信息,都和我们在自己的个人电脑上的信息有着密切的关系。通过对个人电脑上信息的有效分析,能够知道使用者对于哪些领域感兴趣,在搜索上结合这些信息,会使得搜索的效率大大增加,这也是个性化服务的途径之一(当然这会涉及到隐私、安全等问题,这不在我讨论范围之列。)
当然,说到结合方面,不仅仅是上述提到的个人电脑和互联网的结合,还有不少可以结合的地方。互联网的产生使得一台台孤立的主机形成了网状结构。使得你使用的资源更具结构化,未来,当把个体和互联网联系起来,把个体的过去、现在、未来都能联系起来,那么产生的力量将大大超过我们想象。总体大于部分之和,这是格式塔心理学派最著名的观点之一,用在此处,我想是再恰当不过了。
作者:
sowang
时间:
2006-5-1 15:17
三、 搜索界面方面
搜索界面是人与搜索引擎打交道的地方。好的界面设计能使人很快学会使用它、并且乐于使用它。Google的搜索界面,堪称经典。它扭转了过去我们常认为的“多就是美,全就是美”的想法,而转变成“简洁就是美”的观念。Google的界面没有花哨的元素,其保持的简洁性使得人们能够专注于搜索本身,并且不会产生烦躁感。某些小的设计又体现了有趣、活泼之处。
不得不说,现在的搜索界面没有多大的改变,都是一个输入框加上搜索按钮。这在基于符号关键字的搜索领域,我想应该是比较成功的。
未来的发展道路之一,可能会产生基于3D的搜索界面,当然这需要整个人机界面转变成3D的。微软肯定会做这件事,但在多远的未来,我不知道。
作者:
sowang
时间:
2006-5-1 15:17
总结
在此,我从需求的角度,讨论了搜索引擎发展的情况,其实不仅仅是搜索引擎,当我们把目光放远,各个方面都需要牢牢把握住人类的需求。正是需求带动了科技的发展。我相信,我上述所说的内容,微软、google等等都会想到,这也是它们成功的地方之一,永远走在时代的前面去洞察人类即将出现的需求。如果我们想成为领导者或创新者,这么的能力是不能缺少的。
欢迎光临 中文搜索引擎指南网 (http://sowang.com/bbs/)
Powered by Discuz! X3.2