中文搜索引擎指南网

 找回密码
 禁止注册

QQ登录

只需一步,快速开始

搜索
查看: 15976|回复: 8
打印 上一主题 下一主题

腾讯CTO:"四化"是搜索引擎未来发展趋势

[复制链接]
跳转到指定楼层
1#
发表于 2010-7-18 22:19:26 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
 【IT168 报道】7月17日,由中国电子学会主办,透明计算技术与产业联盟协办的透明计算、云计算产学研研讨会在北京翠宫饭店举行,探讨透明计算/云计算领域中新型网络操作系统、移动互联网、搜索引擎、网络化应用支撑工具、UEFI等技术应用的最新发展与挑战,IT168云计算频道对此次会议进行了专题报道。

  腾讯公司CTO熊明华在会上做了“中国搜索引擎产业未来发展趋势”的演讲,他指出,随着互联网内容不断增加,形式不断变化,以及访问方式的多样化,搜索引擎仍然是用户访问信息的入口,但以谷歌为代表的当前主流搜索引擎存在不足,难以满足用户一站式、更智能的人性化搜索需求,这也给其他搜索引擎企业带来了新的机会。腾讯搜搜未来的发展方向是朝“四化”努力,即社区化、个性化、智能化、移动化。以下是其演讲全文速录:


 我们今天讨论云计算、透明计算,其实本质说计算机整个不管是硬件,软件产业的一个革命,他最主要的一个起因其实是跟互联网发展密切相关的。想象如果没有过去10年,互联网在整个行业的发展,其实是不可能有云计算这个概念的。

  一、云计算与互联网发展密切相关

  观点整理:过去15年来,是雅虎、eBay、Google、Facebook这四家企业在引领互联网的发展潮流。而云计算与互联网的发展密切相关,其最尖端的技术来自互联网企业。

  大家都知道云计算其实现在可能谈的比较多的是SaaS,软件成为一个服务的概念。过去像微软,以前我在微软工作过9年,我从做IE、Windows和MSN,我发现一个特点就是微软还是一家软件公司。但是,他不是一个服务型的公司,微软在互联网方面的发展其实一直是滞后的,是远远落后于雅虎、eBay、Google、Facebook,这四家可以说在过去15年,一直在引领互联网发展的一个标杆性公司,我在微博里面曾经提到95-2001年的时候雅虎主宰整个互联网产业发展。eBay是2001-2005年,Google是05年到09年,Facebook从去年开始,未来五年真正引领的是Facebook。这四家公司反映互联网从当初一个很简单服务,到今天可以说影响在座每一个日常生活,而且跟我们整个商业发展,我们平常、日常生活密切结合,可以看出来这个服务,软件他的目的只有一个就是要提供服务。所以,为什么我想回应一下大家的问题,如果去看这个云计算,最尖端的云计算技术就是要看互联网的发展。

  所以,我想这个互联网公司在这方面其实做出了非常多的一个示范,包括我们前面我看了一下,有的公司提到Google,其实是引发云计算这么一个讨论热潮最典型的公司代表,其实也是比较好的互联网公司。所以,我也感到非常荣幸今天有这个机会跟大家做一个交流。

  我想今天主要是从搜索这么一个互联网行业的一个领域,一个垂直领域来阐述一下互联网的发展在未来是怎么一个发展趋势。这个发展趋势从另外一个侧面会反映说,云计算未来的一个趋势。所以,这就是我今天演讲的题目跟整个今天研讨会的一个关系。

  我大概会分四个方面跟大家分享一下这方面的一些体会。第一我会对整个互联网发展趋势做一个简单报告。然后,我会对这个搜索引擎,因为互联网所有技术里面其实搜索引擎是最难的一个技术,也是云计算最典型,最集中的一个代表技术,从这个来讲一下搜索引擎在整个互联网发展的作用。第三个方面讲一下未来搜索引擎的发展趋势是怎样的,最后也把这里面可能的一些技术、产业的机会给大家分享一下。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏
2#
 楼主| 发表于 2010-7-18 22:19:47 | 只看该作者
 二、互联网发展趋势呈现三大变化

  观点整理:过去几年,包括Google、雅虎在内的国外互联网企业在中国的战略大多失败了,一个很关键的因素就在于对中国互联网用户的需求反应速度太慢。而这反过来则成为中国本土互联网企业能够在过去十年一直占据比较主导地位的最主要原因。从技术上看,中国的互联网公司技术水平并不一定比国际企业差,比如腾讯有很多技术创新,但存在多个网络则是中国企业面临的很大的独特问题。

  在座每一位都是互联网的用户,如果现在有谁还不了解互联网的话,大家都认为是互联网文盲,但是大家也都看到互联网在过去发展里面,特别是过去10年在中国的发展,可以说如何去看中国所有的产业,包括我们说的传统软件、硬件、电子、半导体各个产业来讲的话,中国互联网产业跟世界先进水平的距离应该是最近的。就是说,为什么中国互联网公司,大家知道在过去几年几乎国际互联网公司在中国是失败的,失败的原因其实是多方面的。其实一个很重要的原因就是说,这些不管是Google也好,雅虎也好,微软也好,其实在中国互联网方面都失败了,失败一个很关键的因素就是说,他们对中国互联网的用户需求的反映速度太慢。这也是中国互联网企业之所以在过去10年一直占比较主导地位的一个最主要原因。

  但是,我们认为这里面好象跟技术并没有太大关系,我们中国互联网公司技术水平是不是就比国际互联网公司差呢?其实这种说法是错误的。那么,我是05年加入腾讯,我进腾讯之前对国内互联网公司情况不是太了解。去了之后发现像腾讯,我想其实还有国内其他互联网公司,其实在怎么去满足中国用户互联网需求方面,其实他们做的非常多的探索。这个探索期很多是技术的创新,举个简单例子,美国互联网网络其实是非常稳定,全国一张网,但是中国是好几张网在一起的。中国有很大的问题就是说,如果这个用户是在电信网,另外一个用户在铁通网,互联互通问题是非常大的。所以,中国比如腾讯QQ大家都知道,大家都比较喜欢一个特点就是传文件特别快,这是互联网上一个很很简单的用户基础功能。但是怎么能做到传递块,跟其他的东西相比QQ传的非常快,这里面有一个很大的技术含量在里面的。怎么样在跨网之间能通过这种暂存的方式去做的更快,这里面腾讯有很多这方面技术创新的。

  所以,我今天讲这个就是想介绍过去10年中国互联网企业,不光是在对用户需求方面的一个把握,包括技术创新方面可以说在世界互联网走在一起。刚刚讲QQ传文件,其实有一个很基础的云计算的概念。不管用户在什么地方,我怎么能更快地把这个文件传送给他,这是云计算的一个目标。我们讲云计算其实是一个手段,目标还是怎么在几毫秒之内满足一个用户在任何一个地方的需求,这点其实说是相关的。

  变化1:互联网内容大量增加,形式也发现了多种变化。过去三年来互联网网页数量每年增长93%,富媒体内容的爆发性增长,以及UGC浪潮席卷每一位网民,这些使得搜索引擎的市场不是变小,而是更大了。



  但是过去3年大家看到互联网本身的发展其实有一个大的飞跃,这里面主要表现在三个方面,我觉得要提到。第一个网页,包括网站的数量,这里有一个大概数据都可以看到,在过去3年中国每年网页数量是翻倍的,将近增长90%多,每年都是这样从06年开始到现在。同时网站的数量增长也是50%以上,所以这一点是一个很明确的信号,这种海量的数据爆炸性增长其实是非常对这个计算机的存储和计算能力提出一个非常大的挑战。

  第二个就是富媒体,大家都知道我这里有一个简单数据,腾讯有一个产品叫Qzone,类似与Facebook,里面可以上传你的照片,我们每天接受的量达到1亿张,以前的照片是几十K,几百K,现在一张照片都是十几个MB,这样对腾讯和互联网企业怎么降低存储成本,存储效率都提出非常大的挑战。其实,我们曾经做过一个预测,如果说我们在保持5年前的存储成本来支持现在的用户量,腾讯现在就是一个亏损企业,会把我们几十亿人民币的利润吃。过去腾讯做了很重要一个工作就是怎么减低存储成本,又不影响用户使用的质量和这种效率,这个其实是涉及到很多的问题。包括提到视频,现在短视频是非常非常普及的,任何有一个人用手机,像我们今天开会就可以拍一个马上就可以上传到我们QQ上面,就可以发布出去。这种我们讲土豆网他目前视频数量,已经有3千多万,所以这个量其实还是会继续增长的。

  第三个方面很重要的变化,用户产生的数据超过了非用户产生的数据,在互联网上是这么一个存在的趋势。我想这里举个《时代杂志》,有一年把互联网用户评为当年风云人物,从那年开始发现互联网上写微博上传的一些内容,这个内容已经大大超过了所谓编辑,专业记者,新闻记者他们发表的更多,所以这一点是很重要的三个变化。

  这三个变化引出一个主题,搜索引擎大家每天都在用,也觉得够用了,为什么今天讲这个?我发现搜索引擎它的市场,它的知识涵盖内容和服务的形式越来越大了,目前搜索引擎其实已经在这方面发生很大的一个问题。

  变化2:SNS的快速发展催生了新的在线生活方式,社区+搜索可以满足用户在知识、娱乐、生活、热点互动等四个方面的需求。



  第二个大的互联网趋势变化就是社区变化,搜寻任务,其实把5年以前互联网使用的形态,我们腾讯叫做在线搜索的形态已经变化一个根本性变化,以前大家上网一般就是看新闻,处理邮件,QQ聊天,最多还有玩游戏,大概就是这四个内容。但是,SNS出来之后,大家上互联网的方式完全不一样了,一方面我们从你用户行为被动的,别人写的东西你去看变成一个非常主动,主动的这里面搜寻其实很重要的一个功能,就是Face功能,你可以去跟踪特定的人,特定的事件,但是这些内容会自动产生后推送给你,你有选择的去看哪些跟踪内容。所以,在这里可能是一个很重要的变化。

  比如去年第三季度的时候,Facebook的流量就超过了Google,大家知道全世界很重要的指标判断一个网站是不是流行,或者在成长的一个指标就是他的流量。那么,Google在过去3年里面曾经一直是属于不可动摇第一,但是去年下半年的时候,Facebook的流量超过了,90%都是用户之间互动的流量。腾讯的Qzone的流量跟Facebook用户是在一个数量级的。

  我们可以看到因为SNS的出现,让我们所有用户使用互联网的方式产生一个根本的变化。所以,我们觉得这种势头在未来3到5年还会成爆炸性增长。最近微博很火,大家都知道,最近通过微博也出现很多新的热点,包括学历问题,等问题都传播的非常快。我给大家讲,虽然我在美国生活了11、12年,没有在美国读过书,但是IBM和微软都雇了我,所以根本不需要美国学历也可以找到很好的工作。所以,像微博的出现对我们在座每一个人怎么去把我们在线生活跟日常生活做一个整合,大家都可以看出微博的威力了。所以,互联网的发展是一个让人非常激动的态势。



  那么,跟社区相关我们提到如果加上搜索其实是满足用户的适当需求。第一个是知识型,大家都知道学历风波出现之后,据说百科人物简历很多都改动了,因为这个百科是由大众编辑来做的,不是一个编辑产生的,而是知道这件事的他自己去参与而加上去的,类似于这种搜索问答,包括我们腾讯有一个产品叫问问,任何一个用户提的问题平均1分半钟会得到一个答案,得到答案其中是满意答案的比例超过了60%。就是说我们通过这种问问互动式,通过用户来提问题,其他用户来帮助回答这种产品形态现在已经非常流行了。还有一个本地搜索,就像我来翠宫,从我手机上网大概在什么位置,然后交通情况怎么样,其实这都跟搜索密切相关的。

  还有娱乐,以前的互联网都是自己玩游戏。现在互联网游戏已经有一个变化,大家都知道你把你玩这一局的游戏通过现况实时录下来,再传到网上让人看你是怎么玩这个游戏的过程。你从单纯一个被动去玩,到你把玩游戏的体验分享出来让别人来点评、学习,所以这个社区+搜索的体验,当然微博刚才我有提到。

  变化3:访问方式多样化,预计未来中国互联网用户还会呈爆炸性增长,特别是手机上网未来3-5年会成为主流。



  第三个大的变化就是访问方式的多样化。中国大家都知道现在能上网的设备非常多,除了手机,我具有4个手机,还有2个上网本,像这种我想在座很多人已经感觉到,上网已经不仅仅是在5年前,中国大部分上网是在网吧。但是,以后手机上网的普及和实现,很多人上网,我的统计通过网吧上网在中国很多互联网用户比例已经从原来50%多降到百分之十几,甚至更低。但是互联网的用户数翻了2倍多,这么一个多方式的访问,预计未来中国互联网用户数还会呈爆炸性增长,特别是3G智能手机的实现,和手机本身成本的降低,使得能上网的手机数量会成为一个主流,3到5年肯定会实现的。

  所以,从这个趋势前面讲了三大趋势了。整个互联网不光是中国,整个世界其实大家都可以感觉到这种变化,以前我们讲软件时代,微软的帝国时代的时候,每一次新的版本操作系统Windows,我就做过Windows2000,花了大概5年多做出来,一个周期花布一个新的操作系统,新的软件出现。互联网其实现在已经把这个时间缩短到2年,从过去看一下最新的互联网服务形态,从Youtube到现在Facebook的出现,所以每一两年包括最近的微博出现。大家可以看到互联网加快了整个软件产业的一个更新换代的发展。这个最主要的原因还是因为有广大的用户基础,因为以前的软件其实使用的人是非常非常少的,平常老百姓其实包括卖菜的,或者保安他们不可能涉及用什么软件,但是他们因为现在用上网,用手机,其实他们已经成为这个软件的用户。所以,以前软件用户数量是百万,现在肯定是上亿,这就是我经常有时候跟很多学生交流的时候,说你腾讯是怎么来评判一个工程师的水平。我们就举个例子,如果你在腾讯做的一个产品有上亿的用户在用,你在腾讯就属于专家级工程师。如果你做的产品只有上千万人用的话,我们是叫你高级工程师T3,如果你做的东西不到100万人用就是T2工程师。我们已经把你开发、设计、架构这种软件的能力跟你能支持的用户数其实已经挂钩。这也就是说,你在学校里面给你实验室十几个人用的东西,和拿到市场上给上亿用户用,这个设计理念你计算机整个体系结构,整个的设计架构是完全不一样的。

  所以,云计算的目标是什么?就是希望说分布在各个地方不同的云能服务所有的用户需求。所以,这就是回到这里说为什么互联网真正是在引领云计算这个产业的一个启动和未来的发展趋势,这也是为什么说是因为有这么多的互联网用户作为一个基础,使得这个互联网产业能够有今天这么一个蓬勃发展。
回复

使用道具 举报

3#
 楼主| 发表于 2010-7-18 22:20:34 | 只看该作者
 三、搜索引擎的作用与不足

  观点整理:无论互联网内容和形式如何变化,搜索引擎仍然是用户访问信息最主要、最关键的入口。目前搜索引擎的使用仍然比较复杂,做一次搜索至少需要5步:打开浏览器、输入搜索网站网址、找到输入框、输入关键字、点击查看结果,这其实是最原始的搜索1.0的形式。而实际上用户希望更简单直接的搜索,如在QQ聊天过程中边聊边搜索。

  再回到这个主题,有这么多普通的内容,用户产生也好,还是各种各样的形态。其实,这种海量的数据怎么去把它整理,然后让用户能找到,其实说到底这个还是要通过搜索引擎来作为用户访问信息最主要,最关键的一个入口。所谓信息爆炸这么大,人这么多,访问方式这么不同,互联网应用成千上万,归根到底还是数据的整理和挖掘,和提供这么一个最基本的核心技术。



  我们其实也发现用户的需求,其实跟我们想象升级,我们目前在用搜索的方式不太一样。大家现在用搜索,大部分都是打开一个浏览器,输入一个搜索网站网址,然后找到那个输入框,关键把你搜的东西输进去点结果,出来一个结果去点这个结果。大家看到这个其实至少有5步,你要做一个搜索。但是,其实我们发现这种方式其实是最原始的,我们认为这是搜索的1.0的形式。那么,我们其实做了很多内部调研,就发现我们的用户其实说,其实互联网里面最流行的服务,我们做过一些统计,包括听音乐、聊天,看新闻等等,用户在应用的时候他其实就有这种搜索需求。我们调研发现,比如QQ用户在聊天的时候,在聊天的过程中有73%的用户说他在聊天过程中希望边聊边搜索,边找信息这么一个需求。所以,包括我们QQ空间,我们也做过一个调查发现这些腾讯客户在应用腾讯服务的时候,有一些更直接的搜索在旁边用,而不是要打开一个浏览器然后去做很多步骤。



  所以,我们提出互联网1.0时代和2.0时代的变化,从搜索来讲雅虎这家公司最早94、95年我在IBM也是做第一代互联网的时候,其实雅虎最早他这个公司很简单,他的网站就是一个目录,就是把有线的几个网站就像我们电话的黄页一样,这么简单的东西。95年上市的时候,他们公司产品是一个网站目录,但是现在来看这个东西是非常没有技术含量,完全是人工去搜去编辑的。后来雅虎发展很多垂直搜索,不同的类型数据可以去做不同的搜索,包括图片的等等。后来到Google出现了,发现用户很多需求可以做整合的。比如说我经常举个例子到北京来打关键字长城,这个关键字长城输到搜索引擎里面,找长城的照片应该去主页搜索。如果找一个关于歌唱万里长城的歌曲去音乐搜索等等,但是Google做了一件事情,他们就是把用户的需求通过他们的一个比较智能判断来尽可能发现用户需求的数据类型是什么。但是,我们发现Google这种搜索方式到今天我们已经发现他出现很大的问题了,大家可能不知道你到Google上去搜索是搜索不到任何Facebook上面的网页信息。虽然Facebook已经成为世界上最大的一个互联网网站,但是Google是搜不到的,搜不到的原因一方面是政策方面原因,Facebook这家公司就禁止Google来爬伏他的数据,所以Facebook是自己提供自己的搜索。



  第二个原因因为这里面涉及到很多个人隐私的问题,Facebook里面是你跟好友的互动信息。Facebook其实是一个非常有这种个性化信息里面,但是Google的搜索引擎是一个公开谁都可以搜,当然国内有一些过滤,有一些是内容过滤的,但是总的来讲目前的搜索引擎是一个纯粹针对公开信息。Google面对一个很大的困境,这种搜索的浪潮使得他不能帮用户去满足这种需求。这也是为什么提出互联网2.0时代也好,搜索引擎2.0时代也好,怎么去满足前面提到信息爆炸,第二方面怎么为用户提供更贴切的搜索服务挑战。
回复

使用道具 举报

4#
 楼主| 发表于 2010-7-18 22:21:01 | 只看该作者
  四、未来搜索引擎的特点:四化

  观点整理:腾讯将未来搜索引擎的特点总结为“四化”,即社区化、个性化、智能化和移动化。现在的搜索引擎无法满足用户在这四个方面的根本需求。

  现在新的互联网发展已经要求我们一方面要提供一站式的搜索服务,不要让用户跑来跑去。第二方面让这个搜索引擎能够更智能,能知道用户想要什么,第三个就是说每个用户都需要个性化的搜索服务。这一点就为我们来设想下一代搜索引擎提供了一个非常坚实的基础,就是用户需求。所以呢?讲到未来的搜索引擎特点,我们在腾讯归结为四化,这四化首先是社区化、个性化、智能化和移动化。这就是现在的搜索引擎,还不能满足用户在四方面一个根本需求,需要我们在这四个方面做一些根本的改进。

  1)社区化:社区搜索整合的目标是为用户提供一站式服务,比如在Facebook、QQ里搜索与某个用户相关的内容,依托社区网友的内容,可以实现更准确的搜索。

  那么社区整合,社区搜索整合其实目标就是为了用户提供一站式的服务。比如你到Facebook,到QQ里面要想搜索,其实这个内容一定是跟你这个内容,跟你这个用户本身有关的,跟你在的社区是非常有关的。



  这个搜索本身是一个社区化也让我们从一个很简单的重复性的,目前的搜索引擎每月有上亿的用户来搜关键字,其中大概真正每一天里面重复的关键字不止一个人甚至有几百人上万人搜同一关键字的比例超过80%。但是我刚刚举个例子,我搜长城,每个人想的不一样的。我从外地来可能是想去长城旅游景点,如果没有车想搜长城牌的车,想喝酒是搜长城葡萄酒,目前的搜索引擎做不到的。我们为什么提到搜索社区化,我们有Qzone这么多用户产生的内容和信息,使得我们有可能去了解用户的需求,更准确把握这个用户。



  所以说SNS,包括大家很多人都用QQ群,每个人加入很多QQ群,有摄影爱好加入摄影群,在摄影群里面搜索尼可能是相机,所以说我们通过这些可以为他们提供非常准确的搜索,这是我们现在讲到的这些。

  2)个性化:Google的个性化搜索产品iGoogle之所以失败是因为必须要用户先注册帐户,而大多数用户并不愿意。而腾讯有相当大的先天优势,因为腾讯的用户基本都有QQ号,因此为个性化搜索服务提供了非常好的基础。



  个性化Google当时也是非常想作个性化搜索,其实有一个产品叫做IGoogle,有一个用户的帐号进去之后,他把所有历史搜索的帐户进行搜索挖掘,来判断你想搜索什么,很显然Google这个项目失败了。他很多是想搜索,不想创建一个帐号来做这个。反过来腾讯在这方面具备相当大的优势,来腾讯的这些用户基本上都有QQ号。QQ用户在QQ上的ID的身份其实是非常明确的,他在这个方面使得腾讯有机会在提供个性化搜索方面有一个非常好的基础。这也是为什么现在的包括Google、百度这种搜索引擎很难做到这一点的。这就是说我们可以来解决这两个问题,就是把用户相关内容和了解用户真实的意图这两点能够真正的做到。

  3)智能化:智能搜索要求更懂用户的需求,比如在QQ聊天时进行情景搜索引擎可以实现更准确的判断。



  所以,因为有社区化、个性化这些数据,使得我们搜索可以更智能,更懂得这个用户。举个简单的例子,在QQ里聊天,我们提出一个概念是情景搜索,在QQ里聊天,两个人聊事情的时候,我们这里是两个人在聊天,中午去哪吃饭。我们其实QQ是能知道这两个用户的IP的地址,可能是在深圳的南山区。他们聊中午吃什么东西的时候,我们可能知道他们对哪一类的餐馆比较喜欢,我们可以在他的聊天窗口旁边通过一个快捷键就可以搜到。我们可以更好的更快的满足用户的需求,包括去的地址和地图我们都可以整合起来。



  4)移动化:中国普通网民移动化的浪潮已经存在,2009年手机上QQ的用户增长了300%。

  第四个化就是我们说的移动化,我们发现在09年开始通过手机上QQ用户那一年增长,那一年整个QQ用户增长大概30%多,但是通过手机上QQ的用户增长300%,这还是09年的数据,我们今年发现这个数据可能会更大。也就是说中国普通的网民移动化这个浪潮已经存在了,我们今天也发现上星期刚好我们发现说我们的无线搜索的数据,我们本来在年底定了一个目标,但是我们发现上星期已经突破了年底的目标。也就是说我们发现无线搜索的用户增长也是非常快的。



  讲了这些,举一个简单的应用场景的情景搜索,通过手机其实用户将来从他找地址,通过用户互动信息,通过点评方式找哪家餐馆找座位,手机付账都是通过搜索来实现的。用户这么大,从搜索也好,移动化是未来三年腾讯发展最主要一个重点。
回复

使用道具 举报

5#
 楼主| 发表于 2010-7-18 22:21:23 | 只看该作者
 五、腾讯搜搜未来发展战略

  观点整理:中国搜索市场存在巨大的商机,2009年是70亿元,预计到2013年会达到近400亿元的规模。腾讯会把搜索作为一个最主要的业务增长点来进行战略性投入,其目标就是要通过实现搜索引擎的“四化”,即社区化、个性化、智能化和移动化,来为4亿QQ用户提供最贴心的服务,使腾讯搜搜成为QQ用户首选的搜索引擎。不过,在技术和基础建设两方面,这一战略也面临许多挑战。过去三年,腾讯在搜索上的投入大概有7-8亿元人民币,而要实现下一代“四化”搜索引擎,未来3-5年预计要投入30-50亿元。因此在超大规模云计算技术,数据挖掘、自然语言处理和机器学习,隐私的保护和网络安全技术等方面都有很多课题要做。

  讲到这四个化,我们认为未来十年可能整个互联网行业目前的趋势还是会继续的,只会越来越快。所以这里其实给我们提供一个崭新做下一代搜索引擎、搜索技术和相关的云计算技术的一个基础。那么单从搜索市场我们可以看到,去年中国整个搜索市场是70亿人民币,今年大概可以到100亿人民币。我们通过第三方数据知道大概到2013年,三年之后就应该是现在的四倍,将近400亿。从这里来讲,从整个互联网趋势,从搜索本身市场来讲,都使得我们非常看好说在中国去发展下一代的搜索引擎是有很好的一个产业基础的。这个地方的投入是有很好的回报,这也是过去几年和未来几年,腾讯都会把这个作为一个最主要的业务增长点来作为一个战略的投入。



  所以回到讲腾讯搜索的概念就是四个化,我们的目标是要提供QQ用户最贴心服务,如果QQ用户都把腾讯的搜索作为自己的首选的话,我觉得不管是从我们的产品形态,从我们的市场对我们来讲都是非常关键的一个地方。



  技术上的挑战又说回来,我们腾讯在过去三年在搜索的投入大概有7、8亿人民币,7、8亿人民币最主要就是买服务器上面和服务器的一些数据中心这方面。目前为止腾讯搜索在硬件方面的投入其实是超过公司其他的产品,所以说这是第一的。

  我们要提供下一代搜索引擎,提供这种个性化、社区化、移动化、智能化,其实我们在这方面的投入必须要翻倍,我们也预计在未来三到五年我们会投30-50亿人民币在这方面。这里面其实虽然说钱是一方面,最主要就是怎么样去支撑上百万台服务器并行异地的运算的机制,这其实对我们技术人员提出非常大的挑战,也是对我们的一个技术人员的投入点。



  除了相关你有这么多的服务器提供计算能力和存储,其实还需要在数据挖掘方面,把这些可以说其他深非常的领域做投入。大家知道在学校里面做研究,其实最难的是数据,拿不到那么海量的数据,这也是我们腾讯在过去以后和未来我们跟科研机构、学校合作的一个,我们提供一个最主要的支持,我们提供海量的数据给大家进行科研。另一方面我们希望有科研机构在数据挖掘机构的算法能给腾讯,能给我们互联网行业提供更多的帮助。

  当然其实还有一个很重要的就是个人隐私的问题和网络安全的技术。大家知道这种腾讯做网络安全技术团队有五六百人,是非常疲惫,因为这种安全问题还只是一个常态,不是说你做了东西出来,防火墙放在那就行了,每天要有运行,就跟做产品安全方面这方面有挑战。其实在基础建设上还是多网这个问题没有很好的解决,呼吁一下这方面包括工信部和有关的部门能够给我们中国的云计算和互联网的发展提供一些非常基础的硬件支持。三网合一是很好的发展,三网合一最终目的就是把互联网应用从目前简单的互联网扩展到其他两个网。这个其实是让我们来实现一个所谓任何时候,任何地点都能进行在线生活的活动基础。

  当然我们也觉得说,搜索本身包括互联网产业在中国其实发展,在政策法律上国家还可以做的更多,更好。搜索本身其实是一个很大的增长,提高整个国家信息分享,信息发布的一个最有效的平台工具。搜索本身是能促进国民经济的成长,特别是中国要大力发展服务型行业,在这个方面其实搜索是起了关键作用。我们也希望在法律上,国家能做的更透明,因为中国其实跟美国比,大家可能发现中国这种所谓流氓软件,侵犯版权的情况是非常严重的。这点中国应该已经到了一个阶段,确实应该在国内要强化这种知识产权保护,禁止这种恶性竞争,这种在10年前可能做这个,大家觉得可能不太现实,但是今天已经到了一个非常关键的时刻,应该做这个事情。



  所以,我总结一下,我们认为搜索本身因为有更强的用户需求,更大的一个用户需求。所以,对我们提出来一个做第二代,下一代搜索的用户基础。所以,腾讯的特点就希望能做用户最喜欢的服务,我们的服务更懂我们的客户,我们的特色要把搜索、体验跟我们腾讯已有的这些互联网产品体验进行有机整合,让用户感觉到一站式的搜索体验。最后,我们的搜索核心战略包括四化,这也是整个中国搜索行业或者说互联网行业未来发展的一个重点趋势。

  我的报告就到这里,谢谢大家。
回复

使用道具 举报

6#
 楼主| 发表于 2010-7-18 22:21:36 | 只看该作者
  现场讨论

  社区搜索的隐私问题

  提问:我有个问题,您讲第一代搜索的时候,讲到一个比较早期的方式,腾讯会从四化角度来做搜索,其实像Google为什么不去搜索Facebook,因为要保障个人的隐私问题,那用户上了Q之后肯定也有很多信息不想给别人去访问的。我刚才看您搜的那个结果里面,有一块就是从QQ里面出来的,我不知道这个怎么去平衡它?

  熊明华:这个问题提的很好,Facebook目前跟Google主要是两家公司有竞争关系,所以Facebook不允许Google从里面去扒。技术上也有隐私的问题,因为Facebook他认为他用户团队数据,他这里面用户的结构不想给Google的。因为,目前的搜索技术只是把数据扒出来给用户,但是像Qzone我们能做到什么?因为自己的用户数据结构,因为我知道用户这段数据是不是愿意公开的,因为Qzone里面你发表博客的时候可以要求这片博客给所有人看到,还是只给你好友看到,还是只给你自己一个人看。所以,我们搜索引擎在扒这些数据的时候,就有一个敏感度的参数,这个参数是不是应该给这个用户显示出来。Facebook其实不愿意把这个给Google的。

  提问:我有两个问题,一方面Facebook他有明确,他这个信息是对好友还是对任何人都有这个结构定位,所以这一块我觉得应该不存在这个问题的,因为Google的基数我觉得可以区分开来。第二一个不是他自己的数据,那么Google他提出不做恶的原则,但是现在腾讯已经发展成一个超级规模的企业,是不是因为自己体系内的数据就可以随意去拨备出来,腾讯是可以像Google一样提出不作恶的原则呢?同样的问题,说在法律这一块,刚才你也提到了很多相关法律保障问题,那这里可能是给腾讯的问题。一个反垄断法的问题,腾讯已经为成长为一个新的托拉斯,会不会像百度一样恶意把人的搜索引擎打印过来,做一些很不光彩的事情?

  熊明华:你的问题是什么?

  提问:我的问题是,腾讯已经到可以影响到整个国家安全的层面,会不会有一个自我约束的,像Google一样,有社会责任感?

  熊明华:Google这个事情我就不评论了,说起来有点走题。我先回答你一个问题,其实腾讯在网络安全方面其实跟国家配合还是非常密切的。所以,在这方面其实我觉得腾讯是在为中国网络安全做了很多积极贡献。
回复

使用道具 举报

7#
 楼主| 发表于 2010-7-18 22:21:50 | 只看该作者
  腾讯搜索引擎技术的产业化

  提问:我感觉到非常好,下一代搜索引进四化,个性化、社区化、智能化、移动化,我觉得你这个四化非常好,但是我想提出一个问题就是,你搜索引擎的工具以后主要是腾讯用,还是别的公司也可以用,因为现在每个公司只要是搞互联网的,包括人民日报都在做自己的搜索引擎,这是一个问题?第二个问题也想到数据的问题。

  前几天有一个报道,台湾的一个做饭的大老爷们,40多了4、5点多在撒尿被Google给拍下了,给上网去了,不一定围绕着把这个东西弄起来,其实是在收集数据,说不定哪天就有用。所以,腾讯也在收集数据,主要还是在社区网,在自己的客户群,你们有没有对这些大规模数据的收集想法,有没有其他想法?

  第三个问题我听出来客户群不对外开放的,你有10个亿…?

  熊明华:10个亿的注册帐号,国内帐号在线是3.8亿、3.9亿,不到4个亿。

  提问:这些客户群不对外开发的,因为是你的命根子,对外对你有什么好处,不开发有什么好处?

  熊明华:这个问题非常好。

  提问:第四个问题刚才跟这位先生提的有点相关,你实际上是在做社区内很快的深度搜索,一个比较好的服务形式很快的时间内提供给客户,这是很好的方法,还有推送服务。针对某些特定人群,我有什么样的服务,比如我要开一个国际会议,或者开一个产学研讨会,针对这方面有兴趣的人推送过去,这种有没有考虑,他在今后市场上面有没有一个大的,或者说是人群,分不同的小组,因为推送服务人也挺多?

  熊明华:感谢张院士,这四个问题我觉得非常恰当关键点。第一个问题腾讯做搜索,将来是不是一个开放式的,还是只给自己用。其实目前腾讯,比如我们在全国大概有30个数据中心,主要的数据中心大概有5个,这些数据中心其实的目标是说他是已经可以到为第三方提供这种数据整合服务的。为什么这个云计算,我不知道大家有没有注意,大概2、3个星期前,我们在上海跟思科CEO有一个联合记者会,当时我们其中有一个点大家可能不太关注,我们会把企业服务作为腾讯未来发展的一个点,其中最主要一个点,因为腾讯是做即时通信出身,我们跟一个给企业内用的REM,包括国务院办公厅也在用,目前我们跟思科一个合同可以通过我们这个系统跟电话进行互联互通。这个其实就是我们的一个基础,腾讯现在的战略就是说,希望将来能为更多的企业,包括第三方的互联网在提供这种搜索,包括搜索,包括通讯,包括这种文档管理方面的一个服务。

  其实我们以前的博士都是把这套软件免费给这些单位,他们自己装,自己运营。我们目前已经推出另外一款,我们来做你们来建帐号,不要管要多少服务器,你就告诉我要多少人的容量,然后我来帮你做服务器的运营,这个其实是我们的一个切入点。所以,我们的设备还是思路很清楚,将来包括搜索服务都属于面向企业云计算的,所以这是回答了你第一个问题。

  刚才讲四个问题比较多,所以我们跳一下。针对第二个问题,这个其实4、5年前我们跟高德国内做地图的,我们跟他谈过一些交流合作,高德就做过一件事情,开着车到中国城市去转,后来据说有一些政策上的规定他们被禁止了。我们就跟高德建议说,他们应该到海外各个地方去转,去收集这个数据,这个数据收集我觉得张院士提出一个很好的课题,这个课题就是我们现在做数据挖掘,数据采集的一个很重要的课题,就是说我们怎么让用户,现在的这种Google用车自己去采集的方式他一个是投入大,一个是慢。但是Google还做一个很好的项目,他让用户到上面去填数据,这是我们目前在做的一个数据,比如我们住在中关村一带,你们家附近有什么饭碗或者什么东西,这个东西可以有客户提供…

  张尧学:我打断一下,好象我们对吃饭比较感兴趣,举什么例子的时候一般都是举吃饭,中国有特点,就是行业有行业的数据,为什么新华社他为什么自己做,因为他有几十年包括采访,写的文章这些东西,我就说他能不能获得我们国家互联网企业合作,针对特殊用户做特殊服务,不仅仅是通过行业,还比如包括教育、医疗,因为它是社会主义国家的特点,你搜索引擎和客户怎么样和大规模数据库结合起来?

  熊明华:所以我同意这个观点,在搜索领域有一个技术改革暗网技术,就是藏起来。这个里面跟这个有点类似,包括新华社,包括国家图书馆,包括医疗科学家,其实我们跟医疗方面,我们就跟很多机构谈过,我们现在在做这个。国内有一个网站叫好大夫,比如你看这个病大夫怎么评价,就把评价写上去。但是,当时这个网站建立的时候,他派人到各个医院去抄数据,后来发现中国其实有一些所谓的专家数据,我们现在跟医疗协会机构在谈。

  张尧学:我觉得最好跟政府谈完,政府谈完有下文。

  熊明华:政府能够支持这个最好。

  张尧学:这个解决几个问题,一个是你数据安全的问题,第二个就是你经济模式的问题,首先安全解决了使他们感觉到你不会,比如让人家滥用,或者让人家给你偷走,推动信息化的核心就是把数据整理在一起,然后按照什么样的方式给人家去用。我们做了很多这方面的工作,包括数字图书馆,那是最大的一个数字项目,政府也投了很多钱,起码已经投了10个亿,这个东西做出来以后如果不和你的商业模式挂钩是很难用起来的,风险也很大,需要有一个安全问题,我们国家有很多数据很大都放在那,比你自己收集要强,我们数据有时候可信性有一些问题?

  熊明华:完全同意张院士的建议,如果政府能出面来帮助作为一个产业政策来进行这种集中式的数据整理。

  提问:张院士两个话是两层意思,现在搜索引擎是腾讯的私有技术,这个私有技术如果拿到另外一个领域去弄,另外一个领域搜索数据要放开开来,你们会很乐意把你们的数据拿过去用给很多人服务,包括腾讯也会从中获得商业利益,这样的话风险非常大。因为,开放那些私有领域的技术,比如国家统计局,中国过去40、50年经济发展那些数据,新华社那些数据,包括国家图书馆那些东西,数据一旦开放有一点点安全问题,这个数据价值就会大打折扣。刚才张院士他是站在国家的立场上说,在国家很多重要领域有很多私有数据,你们愿不愿意把你们很重要的搜索引擎数据给那些私有领域去用?

  熊明华:绝对没有问题,可以免费提供。

  提问:一个企业没有商业利益是不会去做的?

  熊明华:我们有一个腾讯公益基金会。

  提问:不一定免费这是一个战略。

  熊明华:所以我觉得说,如果国家把这个作为一个产业来发展任务的话,我们肯定愿意承担。

  张尧学:你的用户群为什么不开放,开放对你有什么好处,什么坏处?

  熊明华:其实用过我们Qzone的用户可能知道腾讯的Qzone是向第三方开放的,目前我不知道有人有没有用豆瓣网,有人提出豆瓣网在Qzone里面就被整合的。中国发展阶段,目前确实有一个最大的问题是什么呢?怎么去保护用户的隐私和防止隐私被滥用,个人信息滥用。

  张尧学:不开放是为了保护用户隐私?

  熊明华:目前我们是有限度的开放,跟我们信任的伙伴才会开放,像豆瓣网,豆瓣网是读书,有一些心得。包括大众点评这些比较好的合作伙伴。当然了我们现在还不能完全开放,完全开放发现有很多国内不法分子滥用,这里也呼吁怎么把这方面更完善一点,更遏制这方面的恶意使用。

  张尧学:服务推送?

  熊明华:服务推送我们搜索目前已经做了一个尝试,订阅你的搜索服务,今天云计算你可以订阅跟云计算相关的一些文章,搜索情况,但是现在还是试验阶段。但是,这一点我们发现是非常有用的,因为特别是对这种科研人员来讲,他要跟踪某一个热点,甚至跟踪某一个会议的情况,他就可以通过这种方式来实现。这一点我们从技术手段上是有的,关键是说怎么去把用户的需求更准确的描述出来,因为现在只是很简单用关键字,比如云计算关键字是不对的,很多事他是不需要关心的。怎么样让他通过自然语言描述出来,我需要什么样的信息,当然人看就看明白了,但是靠计算机处理目前水平还不够。

  张尧学:假如有一个好的服务推送模式,卖给你会很高兴,出很多钱都会买吗?

  熊明华:那当然,说完一个简单中文最核心的技术改分词技术,就是把一个中文话分成一个关键字提取出来,这个分字技术中国做的好也只有78-80%。如果你通过博士论文把研究中文分词做到90%的话,那腾讯来肯定可以给你颁个工程师的称号。
回复

使用道具 举报

8#
 楼主| 发表于 2010-7-18 22:22:04 | 只看该作者
 网友用户数与GDP增长的关系

  提问:刚才你PPT上有一个问题很有意思,QQ的用户数每增长1%,地区的GDP就增加了0.17%,我是想这个研究结论你们是怎么得出的?第二我是不是说反过来说,GDP每增加0.17%,你们QQ的用户数就会增加,这两个究竟是什么样的因果关系?

  熊明华:其实我说的是网民增加,我举个简单例子,08年底金融风暴的时候我们发现东莞珠海那边上QQ用户降低很多,那三个月,大概10月份开始,奥运之后。因为奥运的时候用户降低是正常的,因为都看比赛了,但是奥运之后应该增长就发现那个地方跌的很快。

  提问:他们都上招聘网站去了?

  熊明华:后来我们发现哪些人都没有工作回老家去了,本来都是1月份回家过春节,他们10月份就全部回家去了。所以,我们就感到QQ,我们每分钟都有监控QQ上网的数量,一看就少了很多。我们很惊喜的发现,春节以后原来很多用户数很少的边缘地区用户数增加的非常多。后来我们就派人去调研,比如去云南、四川、湖南、江西那些以前没有很多用户的,为什么突然多了一些用户,那些在广东打工回来没有工作做,就在他们镇上搞了一个小网吧,然后就把周围亲戚朋友都带过去上网。所以,我们发现就很奇怪,金融风暴的时候为什么我们腾讯用户反而涨的更多,并不是说大家没有工作而不去的这些因素。这种某种意义上带动了第四…

  张尧学:有没有地区差,比如在湖南到0.17%,到了广东就0.2%几了?

  熊明华:这是一个抽样的统计,我们目前还没有研究那么精,如果张院士有这个要求我们可以去做一做。但是,很明显我们发现广东省、福建省、浙江省这三个省互联网用户的活跃度是在全国领先的超过北京上海。
回复

使用道具 举报

9#
 楼主| 发表于 2010-7-18 22:22:24 | 只看该作者
 腾讯如何看待云计算模式

  提问:我问一个问题,是关于基础架构的问题,腾讯公司作为这么一个IT公司,他现在在做模式像云计算发展的时候,您觉得有几个关键的部分,为什么?

  熊明华:这个问题提的非常好,因为我们公司内部其实做过很多研究和讨论。因为云计算大家都知道,最早是Google一个工程师提出来的,这个人在08年就中国找过我,因为当时他离开Google去创一家小公司,他当时是被Google派到中国在上海待过6个月,所以他当时就想他这个云服务可以在中国先做个试验,他来找过我聊,那时候我们开始跟踪这个事情。但是从我们现在来看,这个云计算概念提的非常好,但是国内百度是一个框计算,其实就是云计算没有什么框计算不框计算的。

  云计算这个概念提的非常好的原因是什么?他很形象地把怎么来提高整个,我们今天讲计算,就是计算效率怎么更好的提高,进行了一个非常形象的比喻,这是云计算。所以,您刚刚提的这个问题,我们内部讨论有三个关键点。这三个关键点第一就是这个IDC的建设,因为大家都知道中国现在整个互联网公司或者很多基本是借中国电信的IDC,很坦白跟大家讲我们在天津市滨海新区我们建了中国互联网公司第一个大型数据中心IDC,我们是跟英特尔,跟戴尔几个公司合作一起来做这个事情。我们发现这个IDC在中国目前来讲还是非常滞后于美国,这一点是一个关键,我们怎么样在IDC建设方面能够做到真正有这个能力支持。

  第二个关键点,其实跟我们前面提到的,我们中国整个通信网是好几张网交织在一起,网之间的互联互通其实一直是一个很重要的问题,这个是制约云计算将来人口,我们认为是一个最关键的,而且是腾讯公司目前没有能力去解决的问题,需要张院士这样的人来解决。

  第三点云计算对腾讯来讲,还有一个关键点,怎么能把安全性做好。将来我腾讯跟中国电信合作做了一个很大的网,然后让各个企业,各个研究机构都来用这张网的时候,他数据安全怎么来保障,这点其实是挺难的。大家都知道安全这个东西没有100%的安全,做不到100%。所以,怎么在这样的情况下,张院士提到国家的敏感数据,统计数据是没有有失误的,比如有一些数据陈冠希照片有时候问题也不大,怎么做到在安全上针对不同的数据做不同的监控,一个操作。这一点坦白来讲,腾讯开始已经积累相当多的经验,我们跟国家安全部合作很多年,怎么来保证数据安全。但是我坦白讲没有100%的安全,大家也都知道中国美国前段时间在闹,这种永远不可避免,这就是一个无名英雄的战斗一定要继续。

  所以,美国要做云计算,我们要做云计算,将来这种国家层面数据安全的对抗会非常激烈。所以,一点回答您这个问题就是说,为什么这三点是中国将来做云计算的一个从技术角度,因为我们今天谈技术,还不是从产业层面,从运用层面,不是这个层面,单是从技术层面来讲,这三点是最核心的。

  提问:你们现在的业务哪一个业务是最接近云计算的呢?

  熊明华:其实这个QQ IM聊天这个形式跟云计算有点接近,因为有4亿的活跃用户是分布在30个数据中心。我们可以支持实时数据,包括点对点之间,任何用户之间点对点的服务,你上传的照片任何一个好友都可以看到,这个已经做到比较有效率的。
回复

使用道具 举报

Archiver|手机版|小黑屋|教你搜 ( 鲁ICP备16006309号

GMT+8, 2025-2-28 00:17 , Processed in 0.173957 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表