11月2日下午消息,2009年互联网大会“思想者——国际互联网高层峰会”论坛今天在北京举行。
微软亚洲搜索技术中心总经理王永东进行了题为《搜索引擎的机遇与挑战》的主题演讲。王永东介绍了当前搜索引擎面临的四个挑战:第一个是信息量爆炸式地增长;二是搜索的多元化及长尾现象;三是简短的搜索词中如何挖掘更有价值的信息;四是搜索页面的呈现方式比较单一、如何更好地完善。同时搜索引擎还会面临个性化、网络垃圾信息、用户隐私保护等方面的挑战。
此外王永东还介绍了微软亚洲搜索技术中心目前所进行的一些常识,包括视觉化搜索技术、分类搜索、对用户搜索需求的针对性处理等。
前面几位嘉宾的演讲都非常精彩,我坐在下面也是听得津津有味,都差点忘了,我今天其实也要下来讲。我讲的题目是《搜索引擎的机遇与挑战》,主要讲一下搜索引擎面临的挑战、趋势和机会。
从趋势来看,搜索引擎已经用得越来越多,搜索引擎成为了我们日常生活中用互联网不可缺少的工具。而且,搜索引擎的用户增长非常快,前面毛伟同志讲到中国互联网用户的时候,增长非常快。然后,搜索的用户同样也是增长非常快的。大家可以看到,在过去的2年中增长了88%,这是非常快的速度。
不仅仅是用户数增长,而且大家用搜索引擎的频率也在增长,也就是说已经在用搜索引擎的用户,他有的次数还在增加。这其实对于我们做搜索引擎的人来说,是一个很大的挑战,也就是说现在已经变成非常重要,大家用得也越来越多。但是大家还不满意,虽然搜索引擎有很多年的发展历史,大家到今天来说质量有很大的提高,但是跟用户的希望有比较大的差别。可以说对于大部分的搜索池来说,会更好地接入,比如说搜索不够智能或者是搜索不够准确,或者是搜索的效率不够高。
一个很重要的方法,我们把用户用搜索引擎的情况拿来分析,看看大家在搜索中,遇到的问题是什么。比如说我举一个例子,一个用户打进了一个搜索,是数码相机。那么,他打进这个搜索,其实这涵盖的范围比较广,他可能看一个结果,看一个结果之后,他又开始改他的搜索词,改成了性价比高的数码相机,可能又看了一些搜索结果,可能改到了佳能的。那么他在搜索的过程中,就知道了光学变焦和数码变焦的区别。然后,他访问一些网站,如果不满意再回来搜索,有的时候搜索的时间很长,需要花很长的时间,有的用户不是一次完成,可能要分几次完成这个搜索结果。
所以,这也是让我们用户想到,怎么样在搜索的过程中可以更好地做决定。那么搜索面临的挑战第一个是,信息量的增长是非常快的,第二部分是搜索是非常多元化的,而且是长尾的,它有各种各样的搜索词。第三个想到的挑战是,一般的用户搜索,打进的搜索词是简短的。简短的搜索词里面包含的信息量非常有限,在这种情况下,搜索引擎怎么样能够把搜索结果处理得很好,这是很大的挑战。第四个是搜索页面的呈现方式,搜索引擎的页面变化不是太大,最近两年思考比较多一些,做了一些尝试。最后一个是刚才的例子,怎么样用搜索引擎来帮助用户很快做决定。当然,这会遇到其他的挑战,比如说个性化,或者是网络的垃圾信息等等。
我想讲一下第一个挑战,就是信息量爆炸性的增长。从这个图上大家可以看到,网页的数量其实增长是非常快的,这个增长快,其实不仅仅是大家在原来自主写网页的增长,其实很大的程度上是跟网页数量、种类的多元化有关系,比如说现在的视频、图像、博客、问答系统等等,这有各种方式让用户在网络上创造或者是发表自己想说的话的机会越来越多,而且也越来越容易。这种情况下,就造成了信息量爆炸性的增长,也是我们网民用户数量增长非常快,这和互联网在中国的普及度有很大的关系。
在这种情况下,一个很大的挑战,对于我们做搜索引擎的人来说,实际上大规模计算系统的挑战。所以,搜索引擎是很有意思的理念,也就是说我们一开始做搜索引擎的时候,很多时候基础设施哪里来的呢?其实是情报检索来的,看起来像情报检索的东西,但是搜索引擎今天的发展是非常不同的。比如说大规模计算、大规模存储的问题,当然信息大了以后,怎么样有效、快速、非常好地处理这些信息,这也是一个极大地挑战,这也是一个我们发展的机遇。
第二个是搜索的多元化及长尾。这个图的左边我列了一些例子,我要说这可能还不是最不常见的搜索,如果你要看搜索引擎的话,可能是各种各样的。我们做过一个分析,如果从搜索词来看,比如说拿昨天和见今天的比,大概有一半的搜索词不同于昨天,如果你拿上个月和下个月比,它的长尾还是在。当然,这有各种的原因,查询的语言比较复杂,有生活语言、英文单词混合起来等等。而且,我们的网友,现在也是非常有创造性,常常有一些新的词,出来了以后是网络上以前没有的,这对于我们做所讲也是很大的挑战。而且,查询的内容是非常丰富,从生活常识、学术、娱乐等等非常多。用户的需求是不一样的,有的是找官方信息的,有的是玩的,甚至有人喜欢看自己的信息。每天上网查一下看看别人在讲自己什么好话和坏事,在座的如果没有试过,可以试一下。
长尾有各种不同的搜索词,如果你想要处理好,需要不同的处理方法。另外一个挑战是搜索的关键词有,比如说“北京”,或者是“数码相机”,其实你不是特别清楚他想找的是什么东西,比如说“北京”,他可能想找北京的酒店、地图、天气、精典、交通、饮食,这种时候怎么可以和用户交互,让他得到帮助,这样可以帮助搜索引擎更快地找到用户想要的信息。
比如说我们的声音处理跟着手机讲话,可能搜索词就不再是北京了,比如说我要到北京玩,我想找一个地图。看起来是复杂的,但事实上多少了以后,对于搜索是有很大帮助的。
再一个是传统搜索结果页面呈现方式单一,我们做搜索的人注重提高搜索的质量,但是页面的变化不是很大。有搜索框、10个结果、标题和摘要、查询建议。实际上,随着用户的需求这种表述方式并没有满足用户的需求,怎么样做出更好的表述方式呢?这对于我们也是一个挑战。
怎么样让搜索引擎可以帮助大家做决定?我们从这个搜索词里面做了一些调查,也有一些用户调查。我们发现66%的用户使用搜索引擎,他会在不同的时候希望搜索引擎帮他做。但是,做决定的过程,其实不一定很简单,有的搜索种类就比较容易一些,比如说导航类。但是另外一些就比较复杂一点,像我们前面看到的数码相机在这种情况下,怎么样以帮助用户决策为导向的方式,来帮助用户更好地做决定,这是我们很好的机遇。
在我们看到挑战和机遇的情况下,我们做了一些尝试,一个是更好地理解用户的用途,而且使用丰富的方式,帮助涌现实现更好的决策。这个叫做视觉化的搜索,其实用户可以不用打这个搜索词了,比如说这个汽车,这种情况下,他要想找这个车子,只要在上面自己来选,他可以选出不同样车子的情况。在这个地方不太容易显示出来,有机会真正用一下可以感觉到。
另外一个是我们做分类搜索,就是我们拿到这个搜索结果的时候,不只是选10个呈现给用户,而是把这个搜索结果做成分类。比如说搜索词如果是BMW3,可以看到在左上角有不同的种类,比如说你找二手车,或者是看它的零配件,或者是想参加讨论区呢?搜索结果里面也是一样的,不再只是10个结果按顺序列下来,可以分成不同的种类。
比如说你二手车进去,你不用自己改,而是上面一电极,就可以直接找到二手车了。
另外,针对用户不同的搜索需求,可以做出不同的处理方式,比如说你一进来想找什么东西的时候,可以给你新产品介绍等等。如果是一个特别的产品名,像这种情况下,他可能不仅仅是到一些购物的网站,他可以根据用户的反馈做一些评价,包括这个产品的性能、比较,当然这也是可以看起来很清楚。
如果从旅游的角度来说,也是有丰富的搜索结果的。比如说你是要找一个特别的从什么地方到什么地方旅游的情况,它除了把现在有的情况告诉你,还有一些预测。比如说预测这个价格是会涨还是会跌的,比如说我们觉得涨的概念有64%,这有可能持平和跌的概念有多大,这种种都是帮助用户做决定的。
进入我们初步的尝试,现在的工作还是在不断地做各种各样的尝试,但是这个方向是怎么样更好地理解用户的意图,而且满足用户不断变化的需求,帮助用户更快、更明智地做出决定,这是我们追求的方向。谢谢大家!
武锁宁:下面,我们回答一下网友的问题。
网友提问:请问您如何评价中国目前搜索市场的格局,您觉得微软在市场份额上,是否有上升的空间?
王永东:微软开始做搜索相对来说是比较晚的。我觉得微软现在大力投入做搜索,我们当然觉得有上升空间,这一点是毫无疑问的,而且我们是非常有信心的。
网友提问:您数月前加盟微软,想开发更多的针对亚洲功能的搜索,能不能具体透露一些消息?
王永东:将来做什么特别具体的不太方便透露,但是我们追求的方向是更好地理解用户的意图,从文本、网页更好地抽取信息,使我们更好地理解,来帮助用户更好地做出决定,这个大的向是很明确的。但是,具体的项目信息在这里不宜透露,希望在发布的时候给用户一个惊喜。
视频:微软搜索王永东:搜索引擎面临的四大挑战