中文搜索引擎指南网

 找回密码
 禁止注册

QQ登录

只需一步,快速开始

搜索
查看: 11877|回复: 0
打印 上一主题 下一主题

腾讯熊明华:未来搜索产业的发展

[复制链接]
跳转到指定楼层
1#
发表于 2010-7-17 23:12:11 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
 熊明华:这个PPT没准备之前,我先开个头。因为大家可能觉得前面问题我也仔细听了,我也借这个问题大概回应一下刚刚提出的问题。我们今天讨论云计算、透明计算,其实本质说计算机整个不管是硬件,软件产业的一个革命,他最主要的一个起因其实是跟互联网发展密切相关的。想象如果没有过去10年,互联网在整个行业的发展,其实是不可能有云计算这个概念的。



  大家都知道云计算其实现在可能谈的比较多的是SaaS,软件成为一个服务的概念。过去像微软,以前我在微软工作过9年,我从做IE、Windows和MSN,我发现一个特点就是微软还是一家软件公司。但是,他不是一个服务型的公司,微软在互联网方面的发展其实一直是滞后的,是远远落后于雅虎、eBay、Google、Facebook,这四家可以说在过去15年,一直在引领互联网发展的一个标杆性公司,我在微博里面曾经提到95-2001年的时候雅虎主宰整个互联网产业发展。eBay是2001-2005年,Google是05年到09年,Facebook从去年开始,未来五年真正引领的是Facebook。这四家公司互反映互联网从当初一个很简单服务,到今天可以说影响在座每一个日常生活,而且跟我们整个商业发展,我们平常、日常生活密切结合,可以看出来这个服务,软件他的目的只有一个就是要提供服务。所以,为什么我想回应一下大家的问题,如果去看这个云计算,最尖端的云计算技术就是要看互联网的发展。

  所以,我想这个互联网公司在这方面其实做出了非常多的一个示范,包括我们前面我看了一下,有的公司提到Google,其实是引发云计算这么一个讨论热潮最典型的公司代表,其实也是比较好的互联网公司。所以,我也感到非常荣幸今天有这个机会跟大家做一个交流。

  我想今天主要是从搜索这么一个互联网行业的一个领域,一个垂直领域来阐述一下互联网的发展在未来是怎么一个发展趋势。这个发展趋势从另外一个侧面会反映说,云计算未来的一个趋势。所以,这就是我今天演讲的题目跟整个今天研讨会的一个关系。

  我大概会分四个方面跟大家分享一下这方面的一些体会。第一我会对整个互联网发展趋势做一个简单报告。然后,我会对这个搜索引擎,因为互联网所有技术里面其实搜索引擎是最难的一个技术,也是云计算最典型,最集中的一个代表技术,从这个来讲一下搜索引擎在整个互联网发展的作用。第三个方面讲一下未来搜索引擎的发展趋势是怎样的,最后也把这里面可能的一些技术、产业的机会给大家分享一下。

  在座每一位都是互联网的用户,如果现在有谁还不了解互联网的话,大家都认为是互联网文盲,但是大家也都看到互联网在过去发展里面,特别是过去10年在中国的发展,可以说如何去看中国所有的产业,包括我们说的传统软件、硬件、电子、半导体各个产业来讲的话,中国互联网产业跟世界先进水平的距离应该是最近的。就是说,为什么中国互联网公司,大家知道在过去几年几乎国际互联网公司在中国是失败的,失败的原因其实是多方面的。其实一个很重要的原因就是说,这些不管是Google也好,雅虎也好,微软也好,其实在中国互联网方面都失败了,失败一个很关键的因素就是说,他们对中国互联网的用户需求的反映速度太慢。这也是中国互联网企业之所以在过去10年一直占比较主导地位的一个最主要原因。

  但是,我们认为这里面好象跟技术并没有太大关系,我们中国互联网公司技术水平是不是就比国际互联网公司差呢?其实这种说法是错误的。那么,我是05年加入腾讯,我进腾讯之前对国内互联网公司情况不是太了解。去了之后发现像腾讯,我想其实还有国内其他互联网公司,其实在怎么去满足中国用户互联网需求方面,其实他们做的非常多的探索。这个探索期很多是技术的创新,举个简单例子,美国互联网网络其实是非常稳定,全国一张网,但是中国是好几张网在一起的。中国有很大的问题就是说,如果这个用户是在电信网,另外一个用户在铁通网,互联互通问题是非常大的。所以,中国比如腾讯QQ大家都知道,大家都比较喜欢一个特点就是传文件特别快,这是互联网上一个很很简单的用户基础功能。但是怎么能做到传递块,跟其他的东西相比QQ传的非常快,这里面有一个很大的技术含量在里面的。怎么样在跨网之间能通过这种暂存的方式去做的更快,这里面腾讯有很多这方面技术创新的。

  所以,我今天讲这个就是想介绍过去10年中国互联网企业,不光是在对用户需求方面的一个把握,包括技术创新方面可以说在世界互联网走在一起。刚刚讲QQ传文件,其实有一个很基础的云计算的概念。不管用户在什么地方,我怎么能更快地把这个文件传送给他,这是云计算的一个目标。我们讲云计算其实是一个手段,目标还是怎么在几毫秒之内满足一个用户在任何一个地方的需求,这点其实说是相关的。

  但是过去3年大家看到互联网本身的发展其实有一个大的飞跃,这里面主要表现在三个方面,我觉得要提到。第一个网页,包括网站的数量,这里有一个大概数据都可以看到,在过去3年中国每年网页数量是翻倍的,将近增长90%多,每年都是这样从06年开始到现在。同时网站的数量增长也是50%以上,所以这一点是一个很明确的信号,这种海量的数据爆炸性增长其实是非常对这个计算机的存储和计算能力提出一个非常大的挑战。

  第二个就是富媒体,大家都知道我这里有一个简单数据,腾讯有一个产品叫Qzone,类似与Facebook,里面可以上传你的照片,我们每天接受的量达到1亿张,以前的照片是几十K,几百K,现在一张照片都是十几个MB,这样对腾讯和互联网企业怎么降低存储成本,腾空存储效率都提出非常大的挑战。其实,我们曾经做过一个预测,如果说我们在保持5年前的存储成本来支持现在的用户量,腾讯现在就是一个亏损企业,会把我们几十亿人民币的利润吃。过去腾讯做了很重要一个工作就是怎么减低存储成本,又不影响用户使用的质量和这种效率,这个其实是涉及到很多的问题。包括提到视频,现在短视频是非常非常普及的,任何有一个人用手机,像我们今天开会就可以拍一个马上就可以上传到我们QQ上面,就可以发布出去。这种我们讲土豆网他目前视频数量,已经有3千多万,所以这个量其实还是会继续增长的。

  第三个方面很重要的变化,用户产生的数据超过了非用户产生的数据,在互联网上是这么一个存在的趋势。我想这里举个《时代杂志》,有一年把互联网用户评为当年风云人物,从那年开始发现互联网上写微博上传的一些内容,这个内容已经大大超过了所谓编辑,专业记者,新闻记者他们发表的更多,所以这一点是很重要的三个变化。

  这三个变化引出一个主题,搜索引擎大家每天都在用,也觉得够用了,为什么今天讲这个?我发现搜索引擎它的市场,它的知识涵盖内容和服务的形式越来越大了,目前搜索引擎其实已经在这方面发生很大的一个问题。第二个大的互联网趋势变化就是社区变化,搜寻任务,其实把5年以前互联网使用的形态,我们腾讯叫做在线搜索的形态已经变化一个根本性变化,以前大家上网一般就是看新闻,处理邮件,QQ聊天,最多还有玩游戏,大概就是这四个内容。但是,SNS出来之后,大家上互联网的方式完全不一样了,一方面我们从你用户行为被动的,别人写的东西你去看变成一个非常主动,主动的这里面搜寻其实很重要的一个功能,就是Face功能,你可以去跟踪特定的人,特定的事件,但是这些内容会自动产生后推送给你,你有选择的去看哪些跟踪内容。所以,在这里可能是一个很重要的变化。

  比如去年第三季度的时候,Facebook的流量就超过了Google,大家知道全世界很重要的指标判断一个网站是不是流行,或者在成长的一个指标就是他的流量。那么,Google在过去3年里面曾经一直是属于不可动摇第一,但是去年下半年的时候,Facebook的流量超过了,90%都是用户之间互动的流量。腾讯的Qzone的流量跟Facebook用户是在一个数量级的。

  我们可以看到因为SNS的出现,让我们所有用户使用互联网的方式产生一个根本的变化。所以,我们觉得这种势头在未来3到5年还会成爆炸性增长。最近微博很火,大家都知道,最近通过微博也出现很多新的热点,包括学历问题,等问题都传播的非常快。我给大家讲,虽然我在美国生活了11、12年,没有在美国读过书,但是IBM和微软都雇了我,所以根本不需要美国学历也可以找到很好的工作。所以,像微博的出现对我们在座每一个人怎么去把我们在线生活跟日常生活做一个整合,大家都可以看出微博的威力了。所以,互联网的发展是一个让人非常激动的态势。

  那么,跟社区相关我们提到如果加上搜索其实是满足用户的适当需求。第一个是知识型,大家都知道学历风波出现之后,据说百科人物简历很多都改动了,因为这个百科是由大众编辑来做的,不是一个编辑产生的,而是知道这件事的他自己去参与而加上去的,类似于这种搜索问答,包括我们腾讯有一个产品叫问问,任何一个用户提的问题平均1分半钟会得到一个答案,得到答案其中是满意答案的比例超过了60%。就是说我们通过这种问问互动式,通过用户来提问题,其他用户来帮助回答这种产品形态现在已经非常流行了。还有一个本地搜索,就像我来翠宫,从我手机上网大概在什么位置,然后交通情况怎么样,其实这都跟搜索密切相关的。

  还有娱乐,以前的互联网都是自己玩游戏。现在互联网游戏已经有一个变化,大家都知道你把你玩这一局的游戏通过现况实时录下来,再传到网上让人看你是怎么玩这个游戏的过程。你从单纯一个被动去玩,到你把玩游戏的体验分享出来让别人来点评、学习,所以这个社区+搜索的体验,当然微博刚才我有提到。

  第三个大的变化就是访问方式的多样化。中国大家都知道现在能上网的设备非常多,除了手机,我具有4个手机,还有2个上网本,像这种我想在座很多人已经感觉到,上网已经不仅仅是在5年前,中国大部分上网是在网吧。但是,以后手机上网的普及和实现,很多人上网,我的统计通过网吧上网在中国很多互联网用户比例已经从原来50%多降到百分之十几,甚至更低。但是互联网的用户数翻了2倍多,这么一个多方式的访问,预计未来中国互联网用户数还会呈爆炸性增长,特别是3G智能手机的实现,和手机本身成本的降低,使得能上网的手机数量会成为一个主流,3到5年肯定会实现的。

  所以,从这个趋势前面讲了三大趋势了。整个互联网不光是中国,整个世界其实大家都可以感觉到这种变化,以前我们讲软件时代,微软的帝国时代的时候,每一次新的版本操作系统Windows,我就做过Windows2000,花了大概5年多做出来,一个周期花布一个新的操作系统,新的软件出现。互联网其实现在已经把这个时间缩短到2年,从过去看一下最新的互联网服务形态,从Youtube到现在Facebook的出现,所以每一两年包括最近的微博出现。大家可以看到互联网加快了整个软件产业的一个更新换代的发展。这个最主要的原因还是因为有广大的用户基础,因为以前的软件其实使用的人是非常非常少的,平常老百姓其实包括卖菜的,或者保安他们不可能涉及用什么软件,但是他们因为现在用上网,用手机,其实他们已经成为这个软件的用户。所以,以前软件用户数量是百万,现在肯定是上亿,这就是我经常有时候跟很多学生交流的时候,说你腾讯是怎么来评判一个工程师的水平。我们就举个例子,如果你在腾讯做的一个产品有上亿的用户在用,你在腾讯就属于专家级工程师。如果你做的产品只有上千万人用的话,我们是叫你高级工程师T3,如果你做的东西不到100万人用就是T2工程师。我们已经把你开发、设计、架构这种软件的能力跟你能支持的用户数其实已经挂钩。这也就是说,你在学校里面给你实验室十几个人用的东西,和拿到市场上给上亿用户用,这个设计理念你计算机整个体系结构,整个的设计架构是完全不一样的。

  所以,云计算的目标是什么?就是希望说分布在各个地方不同的云能服务所有的用户需求。所以,这就是回到这里说为什么互联网真正是在引领云计算这个产业的一个启动和未来的发展趋势,这也是为什么说是因为有这么多的互联网用户作为一个基础,使得这个互联网产业能够有今天这么一个蓬勃发展。

  再回到这个主题,有这么多普通的内容,用户产生也好,还是各种各样的形态。其实,这种海量的数据怎么去把它整理,然后让用户能找到,其实说到底这个还是要通过搜索引擎来作为用户访问信息最主要,最关键的一个入口。所谓信息爆炸这么大,人这么多,访问方式这么不同,互联网应用成千上万,归根到底还是数据的整理和挖掘,和提供这么一个最基本的核心技术。

  我们其实也发现用户的需求,其实跟我们想象升级,我们目前在用搜索的方式不太一样。大家现在用搜索,大部分都是打开一个浏览器,输入一个搜索网站网址,然后找到那个输入框,关键把你搜的东西输进去点结果,出来一个结果去点这个结果。大家看到这个其实至少有5步,你要做一个搜索。但是,其实我们发现这种方式其实是最原始的,我们认为这是搜索的1.0的形式。那么,我们其实做了很多内部调研,就发现我们的用户其实说,其实互联网里面最流行的服务,我们做过一些统计,包括听音乐、聊天,看新闻等等,用户在应用的时候他其实就有这种搜索需求。我们调研发现,比如QQ用户在聊天的时候,在聊天的过程中有73%的用户说他在聊天过程中希望边聊边搜索,边找信息这么一个需求。所以,包括我们QQ空间,我们也做过一个调查发现这些腾讯客户在应用腾讯服务的时候,有一些更直接的搜索在旁边用,而不是要打开一个浏览器然后去做很多步骤。

  所以,我们提出互联网1.0时代和2.0时代的变化,从搜索来讲雅虎这家公司最早94、95年我在IBM也是做第一代互联网的时候,其实雅虎最早他这个公司很简单,他的网站就是一个目录,就是把有线的几个网站就像我们电话的黄页一样,这么简单的东西。95年上市的时候,他们公司产品是一个网站目录,但是现在来看这个东西是非常没有技术含量,完全是人工去搜去编辑的。后来雅虎发展很多垂直搜索,不同的类型数据可以去做不同的搜索,包括图片的等等。后来到Google出现了,发现用户很多需求可以做整合的。比如说我经常举个例子到北京来打关键字长城,这个关键字长城输到搜索引擎里面,找长城的照片应该去主页搜索。如果找一个关于歌唱万里长城的歌曲去音乐搜索等等,但是Google做了一件事情,他们就是把用户的需求通过他们的一个比较智能判断来尽可能发现用户需求的数据类型是什么。但是,我们发现Google这种搜索方式到今天我们已经发现他出现很大的问题了,大家可能不知道你到Google上去搜索是搜索不到任何Facebook上面的网页信息。虽然Facebook已经成为世界上最大的一个互联网网站,但是Google是搜不到的,搜不到的原因一方面是政策方面原因,Facebook这家公司就禁止Google来爬伏他的数据,所以Facebook是自己提供自己的搜索。

  第二个原因因为这里面涉及到很多个人隐私的问题,Facebook里面是你跟好友的互动信息。Facebook其实是一个非常有这种个性化信息里面,但是Google的搜索引擎是一个公开谁都可以搜,当然国内有一些过滤,有一些是内容过滤的,但是总的来讲目前的搜索引擎是一个纯粹针对公开信息。Google面对一个很大的困境,这种搜索的浪潮使得他不能帮用户去满足这种需求。这也是为什么提出互联网2.0时代也好,搜索引擎2.0时代也好,怎么去满足前面提到信息爆炸,第二方面怎么为用户提供更贴切的搜索服务挑战。

  现在新的互联网发展已经要求我们一方面要提供一站式的搜索服务,不要让用户跑来跑去。第二方面让这个搜索引擎能够更智能,能知道用户想要什么,第三个就是说每个用户都需要个性化的搜索服务。这一点就为我们来设想下一代搜索引擎提供了一个非常坚实的基础,就是用户需求。所以呢?讲到未来的搜索引擎特点,我们在腾讯归结为四化,这四化首先是社区化、个性化、智能化和移动化。这就是现在的搜索引擎,还不能满足用户在四方面一个根本需求,需要我们在这四个方面做一些根本的改进。

  那么社区整合,社区搜索整合其实目标就是为了用户提供一站式的服务。比如你到Facebook,到QQ里面要想搜索,其实这个内容一定是跟你这个内容,跟你这个用户本身有关的,跟你在的社区是非常有关的。

  这个搜索本身是一个社区化也让我们从一个很简单的重复性的,目前的搜索引擎每月有上亿的用户来搜关键字,其中大概真正每一天里面重复的关键字不止一个人甚至有几百人上万人搜同一关键字的比例超过80%。但是我刚刚举个例子,我搜长城,每个人想的不一样的。我从外地来可能是想去长城旅游景点,如果没有车想搜长城牌的车,想喝酒是搜长城葡萄酒,目前的搜索引擎做不到的。我们为什么提到搜索社区化,我们有Qzone这么多用户产生的内容和信息,使得我们有可能去了解用户的需求,更准确把握这个用户。

  所以说SNS,包括大家很多人都用QQ群,每个人加入很多QQ群,有摄影爱好加入摄影群,在摄影群里面搜索尼可能是相机,所以说我们通过这些可以为他们提供非常准确的搜索,这是我们现在讲到的这些。

  个性化Google当时也是非常想作个性化搜索,其实有一个产品叫做IGoogle,有一个用户的帐号进去之后,他把所有历史搜索的帐户进行搜索挖掘,来判断你想搜索什么,很显然Google这个项目失败了。他很多是想搜索,不想创建一个帐号来做这个。反过来腾讯在这方面具备相当大的优势,来腾讯的这些用户基本上都有QQ号。QQ用户在QQ上的ID的身份其实是非常明确的,他在这个方面使得腾讯有机会在提供个性化搜索方面有一个非常好的基础。这也是为什么现在的包括Google、百度这种搜索引擎很难做到这一点的。这就是说我们可以来解决这两个问题,就是把用户相关内容和了解用户真实的意图这两点能够真正的做到。

  所以,因为有社区化、个性化这些数据,使得我们搜索可以更智能,更懂得这个用户。举个简单的例子,在QQ里聊天,我们提出一个概念是情景搜索,在QQ里聊天,两个人聊事情的时候,我们这里是两个人在聊天,中午去哪吃饭。我们其实QQ是能知道这两个用户的IP的地址,可能是在深圳的南山区。他们聊中午吃什么东西的时候,我们可能知道他们对哪一类的餐馆比较喜欢,我们可以在他的聊天窗口旁边通过一个快捷键就可以搜到。我们可以更好的更快的满足用户的需求,包括去的地址和地图我们都可以整合起来。

  第四个化就是我们说的移动化,我们发现在09年开始通过手机上QQ用户那一年增长,那一年整个QQ用户增长大概30%多,但是通过手机上QQ的用户增长300%,这还是09年的数据,我们今年发现这个数据可能会更大。也就是说中国普通的网民移动化这个浪潮已经存在了,我们今天也发现上星期刚好我们发现说我们的无线搜索的数据,我们本来在年底定了一个目标,但是我们发现上星期已经突破了年底的目标。也就是说我们发现无线搜索的用户增长也是非常快的。

  讲了这些,举一个简单的应用场景的情景搜索,通过手机其实用户将来从他找地址,通过用户互动信息,通过点评方式找哪家餐馆找座位,手机付账都是通过搜索来实现的。用户这么大,从搜索也好,移动化是未来三年腾讯发展最主要一个重点。

  讲到这四个化,我们认为未来十年可能整个互联网行业目前的趋势还是会继续的,只会越来越快。所以这里其实给我们提供一个崭新做下一代搜索引擎、搜索技术和相关的云计算技术的一个基础。那么单从搜索市场我们可以看到,去年中国整个搜索市场是70亿人民币,今年大概可以到100亿人民币。我们通过第三方数据知道大概到2013年,三年之后就应该是现在的四倍,将近400亿。从这里来讲,从整个互联网趋势,从搜索本身市场来讲,都使得我们非常看好说在中国去发展下一代的搜索引擎是有很好的一个产业基础的。这个地方的投入是有很好的回报,这也是过去几年和未来几年,腾讯都会把这个作为一个最主要的业务增长点来作为一个战略的投入。

  所以回到讲腾讯搜索的概念就是四个化,我们的目标是要提供QQ用户最贴心服务,如果QQ用户都把腾讯的搜索作为自己的首选的话,我觉得不管是从我们的产品形态,从我们的市场对我们来讲都是非常关键的一个地方。

  技术上的挑战又说回来,我们腾讯在过去三年在搜索的投入大概有7、8亿人民币,7、8亿人民币最主要就是买服务器上面和服务器的一些数据中心这方面。目前为止腾讯搜索在硬件方面的投入其实是超过公司其他的产品,所以说这是第一的。

  我们要提供下一代搜索引擎,提供这种个性化、社区化、移动化、智能化,其实我们在这方面的投入必须要翻倍,我们也预计在未来三到五年我们会投30-50亿人民币在这方面。这里面其实虽然说钱是一方面,最主要就是怎么样去支撑上百万台服务器并行异地的运算的机制,这其实对我们技术人员提出非常大的挑战,也是对我们的一个技术人员的投入点。

  除了相关你有这么多的服务器提供计算能力和存储,其实还需要在数据挖掘方面,把这些可以说其他深非常的领域做投入。大家知道在学校里面做研究,其实最难的是数据,拿不到那么海量的数据,这也是我们腾讯在过去以后和未来我们跟科研机构、学校合作的一个,我们提供一个最主要的支持,我们提供海量的数据给大家进行科研。另一方面我们希望有科研机构在数据挖掘机构的算法能给腾讯,能给我们互联网行业提供更多的帮助。

  当然其实还有一个很重要的就是个人隐私的问题和网络安全的技术。大家知道这种腾讯做网络安全技术团队有五六百人,是非常疲惫,因为这种安全问题还只是一个常态,不是说你做了东西出来,防火墙放在那就行了,每天要有运行,就跟做产品安全方面这方面有挑战。其实在基础建设上还是多网这个问题没有很好的解决,呼吁一下这方面包括工信部和有关的部门能够给我们中国的云计算和互联网的发展提供一些非常基础的硬件支持。三网合一是很好的发展,三网合一最终目的就是把互联网应用从目前简单的互联网扩展到其他两个网。这个其实是让我们来实现一个所谓任何时候,任何地点都能进行在线生活的活动基础。

  当然我们也觉得说,搜索本身包括互联网产业在中国其实发展,在政策法律上国家还可以做的更多,更好。搜索本身其实是一个很大的增长,提高整个国家信息分享,信息发布的一个最有效的平台工具。搜索本身是能促进国民经济的成长,特别是中国要大力发展服务型行业,在这个方面其实搜索是起了关键作用。我们也希望在法律上,国家能做的更透明,因为中国其实跟美国比,大家可能发现中国这种所谓流氓软件,侵犯版权的情况是非常严重的。这点中国应该已经到了一个阶段,确实应该在国内要强化这种知识产权保护,禁止这种恶性竞争,这种在10年前可能做这个,大家觉得可能不太现实,但是今天已经到了一个非常关键的时刻,应该做这个事情。

  所以,我总结一下,我们认为搜索本身因为有更强的用户需求,更大的一个用户需求。所以,对我们提出来一个做第二代,下一代搜索的用户基础。所以,腾讯的特点就希望能做用户最喜欢的服务,我们的服务更懂我们的客户,我们的特色要把搜索、体验跟我们腾讯已有的这些互联网产品体验进行有机整合,让用户感觉到一站式的搜索体验。最后,我们的搜索核心战略包括四化,这也是整个中国搜索行业或者说互联网行业未来发展的一个重点趋势。作者:天极 迈凯轮技师出处:天极网软件频道
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏

Archiver|手机版|小黑屋|教你搜 ( 鲁ICP备16006309号

GMT+8, 2025-2-28 00:15 , Processed in 0.380605 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表