中文搜索引擎指南网

 找回密码
 禁止注册

QQ登录

只需一步,快速开始

搜索
查看: 20237|回复: 6
打印 上一主题 下一主题

搜狗CEO王小川谈智能互联网

[复制链接]
跳转到指定楼层
1#
发表于 2012-3-1 21:12:19 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
【TechWeb报道】搜狗CEO王小川做客TechWeb主办的IT龙门阵,发表了主题为“更智能的互联网”的演讲。他将智能互联网分为三个层次,最高级的智能是技术驱动的机器学习;他还提到,开放不一定是好事,有时封闭才能做到极致。

王小川表示所谓智能,是指像人一样获取信息、推理和判断,最终做出反应的机器能力。

在移动互联网方面,王小川透露搜狗正在开发一款以语音技术为基础的产品,“跟Siri有关但是不一样。” 王小川说:“我们提出一个概念是让用户表达搜索信息更简单。微信里面文字的数量跟语音是3:1,所以在手机的领域里面,如果我们只是守住这种传统的模式,搜狗会完蛋的。”

以下为第149期IT龙门阵实录:

刘兴亮:欢迎各位朋友参加这期的IT龙门阵,我看微博上有人说主持人叫王兴亮,这个姓30多年了一直没有变,今天我们主讲嘉宾是姓王,他是搜狗的掌门人,今天他跟我们分享一下未来的互联网可能会是什么样的,因为我们互联网发展很快,我们信息量越来越大,我们获取信息的手段也会更多,就像现在的美女多了,我们的手段还没有那么多,今天王总可能会给大家提供一些特别的手段,大家掌声欢迎。

王小川:抱歉今天有点咳嗽,声音不是特别大,我印象里面应该是3年前参加IT龙门阵,当时的观点是未来的两三年里面,IE的浏览器可能会掉到市场一半以来,今天这个话兑现了,上次是讲对互联网基本模式的理解,其实更多谈浏览器,谈互联网是渠道这样一个世界,今天跟大家分享,不是预见未来互联网的形态,而更多谈的偏技术的话题,技术在改变我们的互联网,在提这样的话。我们这个题目定的是智能的互联网,下面说智能互联网,我要问几个问题,智能互联网你是怎么做,以及搜狗在这方面的打算,咱们往下看一下智能。

这种智能通常理解的比较简单,就是人工智能,我干了两个事,一个事是翻了一下百科,什么叫智能特别绕口看的我也很晕,什么感觉到记忆的一个过程,还不如我用一句话简单的概括,描述就是像人一样获取信息,这个定义比百度上大家更容易接受一些。谈到这样一个智能的时候,我们就要回到一个很早的话题97年,有一个著名的事件就是深蓝击败了卡斯帕洛夫,机器下象棋比人干的漂亮,但是在随后若干年里面有一个进步,人工智能进步在中间是非常的迷茫,大概60年代的时候提了一个智能的定义,有一个叫图灵测试就在讲这个事,把人放在终端,这个终端背后可能是人可能是机器做问答,如果人不能正确的分辨背面是人还是机器就是这个智能过关了,今天大家还在拼命的研究,但是成果进展还是比较慢,机器智能从60年代后整个学术界是比较迷茫的,走规格道路进展比较慢,走统计道路进展的也不算快。我在想图灵测试的时候,我们换一个话题来说一下就能理解,如果我们对面做的是QQ,你不知道背面坐的是人还是机器,把QQ当成一个软件,就是把QQ连接的互联网看成一个软件,你跟他能够自由的对话,你不管背后是谁,给我们一个提示,如果走单机没法实现这么一个智能,但是你面对的不是单机,是面对一个互联网,你是在面对的QQ的终端,QQ这个互联网包在里面,后面装几个人跟你随便的对华,QQ软件连上互联网是可以满足图灵测试,这个听起来有点强词夺理,但是给我们一个概念,互联网的本身把人作为中间的有机整体放进去是有智能在里边的。这比我们做软件的让程序员写是不一样的局面,如果我们这样做理解的时候,重新看这个智能怎么做到的,分了好几个做法,我们先看一个。

如果我们做到了这样一个智能,有几个模式?我画的第一个图可能大家不愿意接受,画的机器很智能跟人一块上网,随后又有两个模式,一种是把互联网本身做的很智能,就是互联网应用很聪明能跟人这样对话。画了第三个图,是第二个图的延伸,我们搜狗想干一个事情,把自己做的很智能,但是他作为一个人和互联网的中介,使得你跟互联网做沟通做连接的时候能够变得更加的聪明更加方便,所以你面对的互联网智能像网官一样,而不是简单的把互联网的应用变得很聪明,这两个模式我都把它称作互联网的智能方式。搜狗更多走的是后面的情况,但是待会我谈到智能模式的时候,把我们的做法放进来。

这时候你发现搜狗是机器人这样一个位置,当你用户做表达的时候,我能够把你的表达听的更明白,传递给互联网,希望这种文字输入、语音输入变得很智能,一下子听懂你在听什么,甚至一些简拼他就知道你要什么。另外像我们做浏览器也好像做搜索也好,就是懂用户,把互联网适当的信息提供给你。这样一个使命老实来讲去年的时候已经树立清楚了,因为在若干年前搜狗作为搜狐的部门,我们的责任就是做搜索,10年我们开始有自己的掌舵,开始思考,所以我们重新做了一个使命,让中国网民表达和获取信息更简单,怎么做到就是用到智能这样一个技术改革或者革命。

因此在里面提到了实现智能的三个层次,其中第一个层次,不是今天主题里面强调的,只是用来做一个对比,就是说这个智能是基于产品经理和设计的智能,这个产品设计的时候有非常优秀的产品经理,甚至是工程师,把自己怎么住进去这样一个聪明。第二种是在挖掘互联网的智能,就是提到的这个概念,在互联网里面有很多的智慧,散落在网络的信息,把它挖掘出来改进或者构建一个新的产品。第三种智能是向用户学习的智能,大家给大家讲这三个方面。

简单看第一个,给大家看到的智能提到了,这种集合了团队的智能,就是研发团队、开发团队、设计团队,里面有顶尖的工程师或者里面有几个顶尖的设计人员,把你们的想象力,把你们对用户的需求理解注入进去,能使产品更好用。举个例子,我觉得之前我跟输入法接触多了,老提到紫光输入法,为什么紫光比微软好用,微软的叫职能ABC也没它好用,大家觉得它什么地方改进了?有人还有印象吗?

提问:选字。

提问:词组。

提问:打一句话。

王小川:打一句话和打词组这个讲的比较在理,如果我们敲紫光输入法的时候,只要词库里面有这个词就可以做个连接,这个是很巧妙的,这个就是讲的紫光华语的搜狗拼音输入法,或者换个字,我们打个搜狗公司,如果词库里面有搜狗有公司,就可以把手写的连接打出来,这就是研发这哥们脑子好使,就想出这事了,微软就是脑子不好使就想不出这事。其实今天大多数设计是停留在这个阶段,对产品人员要求也非常高,这是第一种方法,后面的方法我不是很想分优劣,只是非常不同的概念。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏
2#
 楼主| 发表于 2012-3-1 21:12:34 | 只看该作者
第二种方法是把互联网的智慧挖掘出来,融入到自己的产品里去,这样的话就有千万上亿的用户帮你贡献这样一个智能,在这里面我举两个典型的例子,一个是搜狗的搜索引擎,其中提到搜狗搜索引擎一个核心技术就是PageRank,另外提到搜狗的拼音输入法,这两个产品能够显出智能聪明,就不光是他的工程师,或者他的产品经理脑子好使了。PageRank这个技术,简单讲搜狗干了一个很重要的活,就是在互联网提出超链接的信息,就是对PageRank概念了解的,好像不是很多,比我想的低了一点。如果当你查询搜狐这个词的时候,我们应该把搜狐的首页呈现在你面前,如果在互联网上有很多的网页,里面也写上了搜狐两个字,标题也是搜狐,内容也是搜狐,如果用传统的,这里面就排在最前面,但是搜狗很聪明,他说不对,其实在搜狐首页上没有写搜狐这个字,一定有一个提的比他多。他怎么做的,他去做两件事情,第一件事情对于两个网站谁更重要,他会看有多少连接点到这个网站,有多少外链指向它,我们做优化的时候有这个概念。

就是有个模型,就像冲浪一样的,最后计算在整个互联网里面,如果一个页面分出10个链接,就加10个权重,就会把这些权重流出去,计算在互联网里面,每一个页面到底有多少重要的页面指向他。就像人一样的,你说这个人厉不厉害,你自己说不算,是别人说你厉害。而且这个本身就是大家公认的权威,他说1句话顶你10句,这样一个技术挺难的,但是在于他采取了互联网的信息。别人指向你可能是编辑或者网民的智慧表达,代表他的判断,但是一个判断是没用的,就是把互联网全抓下来,在里面反复计算,哪个页面重要信息,每个页面的重要性指向别人的时候带来的,以及指向别人的时候,这个链接上说的是什么。如果这个链接说是搜狐,这个网页可能就跟搜狐有关系。就谷歌干了个事,另外整个互联网在里面做信息的提取,最后能够计算出来每个网页的权重,这个网页究竟跟什么主题相关,有什么内容,不是靠这个网页内部的信息,就避免了大量信息的干扰,这就是一种智能的方向,这个技术不管是谁提的,但是他的聪明最后都是建立在了互联网网民的智慧之上的,这是对谷歌起很重要的理解。

搜狗在里面做的事情会简单很多,但是跟大家理解的还是不一样,搜狗好在那个地方,最早是说词库全,很多人以为这个词库全是来自于搜狗的搜索引擎,用户在上面的一个简缩,这个事情是有偏差的,因为在那个时候,搜狗搜索引擎不够大,不够全。第二用户简缩的词跟输入的词不一样,所以说搜索引擎入手解决不是最好的方式。我们会理解用户写作一定会把他的词他的句子他的语法留在互联网的网页上,所以不是从搜狗搜索引擎里面取词,而是从网页里面寻找答案,如果这个网页里面更新了新词,我们有发现技术就能知道新词出现了,而且我们知道词频,就像这种精华,还是精华时报,还是精华素,这种词在互联网出现的词频是不一样的,我们就知道哪个有用。更重要的是做一篇文章的时候做一个句子,每两个词每三个词甚至语言搭配的习惯,我们也采集下来了,这样使得输入法词库全,词频的高低,以及语法的规则得到了高的飞跃,所以输入法就得到了很高的智能,这也是成功的一个案例,说明聪明的东西从互联网上挖掘,这是第二个智能的事情。

第三种大家听的比较多也容易理解,就是自学习的能力,产品上线根据用户使用中间的反馈,进行自我的改进自我的优化,中间有个经典的例子谷歌的广告系统,我们在说搜狗拼音在这里面也做了一些工作。我们可以看一个页面,左面谷歌的广告系统有多少人接触过这个事,好像更少,广告系统我知道是非常神奇的系统,比如在晴天在雨天的时候展现的是不一样的,因为他知道晴天的时候公园的门票更容易卖一些,雨天的时候不是,节日的时候跟非节日的时候鲜花的展示是不一样的,这是极其聪明的系统。他知道在哪一天哪个时间甚至哪个人他对哪个广告更感兴趣,所以计算出来概率有多大,这是这样一个技术,在国内里面不管是百度也好还是什么也好,跟他这个技术还是有非常大的距离,这是一种智能,这种智能怎么做到的?我们通常用的词是继续学习,我们还会用这样的词解读,他是用前人之前点击的习惯发展的。

在雨天的时候他会发现什么广告点的多,在节日的时候什么样的广告点的多,你就要优化这个系统,广告是跟着环境来走的,就是雨天的时候这是一个特征,雨天加上什么节日,再加上哪个类型的广告是这样一个特征,这里面工程师会抽取大量的特征,他知道什么样的广告什么样的节日,把这个脱离出来,然后带到这种模型里计算,就是算一个概率体系。就是出现什么样的特征,会有哪个概率提升,他的特征有多少,一共抽了多少特征出来,我拿到数据他抽了10的19次方,及其海量的,我知道国内百度是1000万,可能现在是多一点了,这里面要做一个大量的计算,才能够去满足把这些给算出来,这是最极端的例子,我们内部也是要走这种方式,10的19次方对技术团队是非常非常大的事情。另一个例子是个性化,就是对每个人都会不一样,一种是跟着节气来走,就像五行八卦一样,第二种比较简单,但是大体都属于这样的范畴。说个简单的事情,今天可以当成一个玩笑,大家有手机可以掏出来输入JB这个词,干看你们的第一个词是什么。
回复

使用道具 举报

3#
 楼主| 发表于 2012-3-1 21:12:45 | 只看该作者
提问:疾病。

王小川:如果用智能输入法调屏呢?

提问:加班。

王小川:有叫基本的,即便是IPhone大家也会不一样,我见过有人是加班的,有人是进步,有人是金币。

刘兴亮:酒吧。

王小川:看这个人的品位就已经知道了,还有的是举报,我有一个朋友是在平安做保险的,今天的智能使得每个人的体验是不一样的,你可能无意识对你做这样的服务,就是复杂和简单的技术。往下搜索引擎考虑在海量的词加上这样的成分,这样我们基本把这个智能分成三种方向,第一种是你的程序员、产品经理他的智能,为什么现在产品经理很贵,当然指着他能够把自己的智能做出去。第二种是从互联网挖智能,第三是靠学习,这三个是不一样的。

先说一下优缺点,第一个来说,第一种是靠规则驱动,就是产品经理会想出一些规则放进去。第二种是挖智能的时候,核心是模型建立是挺诡异的,它跟第三个不一样,第三个做模型的时候是贴近你的体验,因为你知道你的原始数据和你最后改进的体验是在一个位置,用户点击了,就代表未来同样的用户会更喜欢点击,这个事情不是。这个模型你挖的数据和你的产品是两件事,这时候考的是想象力,你把两个世界连接起来了,从一个完全不相关的世界里面挖出另外一种智能为你所用,他的模型建立会更加的难,得到好处解决能启动的问题,就是你的产品上线头一天可能就挺好用的。因为智能不是来自于用户的使用,是来自于对另一个系统信息的挖掘,另外具有一定的海量数据处理的能力,上百亿的数据抓取,它的分析、统计、渠道,这是第二个事情。所以好处是能够解决能启动的问题,难点是模型,到今天你不会特别成功的例子。

第三个事情是用户参与学习的系统,这个系统我们刚才强调了做法里面就是这个很重要的特征提取,需要用户大量日志,就是你产品必须上线已经有规模了。当你特征如果是10的19次方的时候,比如说1万个特征,你需要的日志通常是10倍才能做训练,才有这样一个基本的概念,所以10的19次方的特征需要更多的数据,然后靠大量的计算进行,一个比一个难度大,所以递进关系我看的是一个难度,从效果上说是解决不同的问题,不是越难的事情就越好。后面这个事情就叫做机器学习,在这方面国外的高效益是很多的,他跟谷歌是对口的,国内最优秀的工程师跟国外的像惠普、雅虎流入到中国来,这方面还是处于延伸的状态,就是向用户学习,变成了机器学习的功能。这是我讲的三个智能的方向,但是给我们一个概念,二三其实都类似,就是指你的智能,不是产品经理想出来的,而是靠你的技术人员驱动,我提一个概念,从互联网挖掘智能,能够构建出一个更智能的互联网来,大量今天的广告系统,搜索引擎都是走这样一套道路,这个事情我觉得就是一个跨界,产品经理有时候想的一个事,但是缺乏足够的能力去做这个事,工程师跟他的想法不一样,怎么把两方面的经验和能力融合起来解决问题,才能够把这个互联网智能和用户的智能用好,这是今天的挑战。

讲完之后就大概提到了智能这部分我们的理解,代表了行业成熟的做法,剩下的时间简单提一下部分产品上的增加,正在做的事情。今天会发布一些不是全部的,分环境的输入法,一个是互动搜索,一个是探索引擎,我们可以简单给大家做一个概念上的叙述。我们知道输入法的智能是跟个性走的,每个人都一样,当我们新的版本就会分环境了,你在不同的场景下让你更省劲。我举个例子,大家可以看一下我们敲了同样的词叫做qiz,不同的应用环境下,会直接给你不同的结果,你在淘宝的时候敲这个会给你情侣装、清凉装这样的排名,但是你进入到音乐或者搜索跟音乐相关的,给你的第一个是千里之外,同样的一个词在不同的环境对应不同的内容,图片里面搜索是情侣照,我们会把个性化接的更紧一些,今天就不讨论这个技术了。

第二个要做的事情就是向网民学习通过大量的分析做的工作。我们如果输一个糖尿病,会有一个分类的目录,你是要糖尿病的饮食、治疗方法、医院,不一定是用户以前输入过的,我不知道在谷歌百度后面排出来的几个,搜狗其实浏览器有注册用户,这些注册用户他们有很多收藏家,收藏家里面有名字,会有这样取的分类,这些都是原始数据,加上在搜索引擎内部去构建体系,根据用户的行为做一个训练学习,使得这样的系统更准确。用户跟机器之间的距离,我们今天在这方面会有产品上的发布,这个事情不是我们今天才想的,我们在04年就琢磨这个事了,当时我们有两个问题,把这事搞砸了,第一个是04年的时候搜狗的引擎品质跟百度产品差别比较大,第二点当时这种分类,比如说比你用户输的关键词还要抽象,比如用户输个苹果,会给你什么呢?农业科技,这都对,你问的是5块钱一斤的苹果,还是苹果公司生产的电子设备,你给的逻辑是不满足客户需求,我问你苹果你给我农业或者科技的时候,他要想半天才知道你说什么,这个事情不是把用户需求往细里走的,这是我们原来产品设计里面出的巨大的差错,历史是在螺旋上升的,我们到今天又开始重新琢磨这个事情。

再往后大家如果对媒体关注,会推出搜索引擎的系统,用户当前浏览页面的时候根据你个性化需求相结合的全网内容,根据相关的音乐、视频、图片、百科、网页给你,你只要在浏览过程当中用的是搜狗浏览器,土建插件的浏览器,就能享受到把互联网相关内容直接带给你的快乐,传统引擎有做类似的,就像亚马逊也做,淘宝网、人人网也作,但是他们做的很简单,只做内部局限的一个推荐,这种训练学习会简单很多,我们干了一个野心比较大的事,就是搜狗全部推荐,你在浏览互联网任何页面的时候,我们会推荐可能互联网任何的信息给你。看一下简单的页面概念在,你在访问页面的时候,下面就会有一行推荐系统,里面有价格的东西,然后还会有评论,或者其他优惠券就会提供给你,有一个开放数据库,另外这个难度和搜索引擎不相上下。我一直跟我们内部的人员说,搜狗的瓶颈问题不是技术问题,我们原来遇到的是产品跟百度太接近了,或者说资金太少了,搜狗这两年快速的成长,我们现在有各种力量去主导一些新的地方,不是只是做一个完全的跟进,我们觉得有底子开阔更新的领域,这是新的引擎,大家可以试试,看看搜狗发布出来大家会不会喜欢。
回复

使用道具 举报

4#
 楼主| 发表于 2012-3-1 21:12:59 | 只看该作者
第四个我们也会发布,是什么一直没说,今天也不会说,只是知道跟语音有基础的。所以姑且把它放在这里面,这是未来在讨论的方向,我就知道搜狗本身而言,我们提出一个概念是让用户表达和获取信息更简单,我们知道在手机上做表达的时候,按键盘的比例越来越低了,我前段时间问了张小戎,我说在微信里面文字的数量跟语音是几比几。

提问:10:1。

提问:1:1。

王小川:今天大概是3:1了,文字多,所以在手机的领域里面,如果我们只是守住这种传统的输入模式,搜狗会完蛋的,这里面最好给大家介绍一下语音技术的难度,在国内最火的是讯飞,牛在什么地方?其实是有科学含量,但是又走向实践的这样一个公司。我们通常发现有很多公司,有实践就是面向市场去做,但是做科技技术少了,更悲催的事情是有科学技术的这些,研究机构对市场特别敏感。做语言最重要的是语料库的收集整理,就是你手上有大量的人说话的语言,并且把它标注成文字。比如今天说了一个刘兴亮,或者一个正句,我要知道这段话对应的是哪几个字,这就是构成了这个事情的核心。会有什么问题?我们今天用手机的时候,大家说话可能是有方言,普通话不够标准,有背景噪音,但是做研究的那帮人,他们做实验的时候都是请的播音员,这种数据做好了之后,测试也通过了,你拿到市场没法用。

讯飞就说我这个语音的数据就来自于数据手机的,带口音的像我这种,甚至更差的,这样才能达到更正式的效果。如果不好用大家就不用了,如果过了第一关大家用上了,他就会源源不断的收集到数据。今天大家如果用讯飞,如果你收集到了300小时的数据,就属于勉强可用了,就是百度的语音水平,错误还挺多,10错4个吧,就是60分。随着数据收集越多,你的效果也会更好,如果你收集到700小时的数据,你大概只能做到80分,就是10对8个,如果数据收的越多,编辑成本就会更高,编辑效率就会更低,你可能到3000小时的时候可能到90分,大家拼的是数据的收集,还要编成文字。讯飞我估计是3000小时到4000小时之间。

构成的门槛怎么收集这些数据做标准,怎么解决这个问题,搜狗这个问题已经解决了,我们之前在春节左右上线了安卓输入法2.3版本,这个版本用的不是自己的引擎,所以里面我用谷歌的引擎,谷歌的引擎只要你说的话,谷歌给你做识别,同时我把这个语音给搜狗发了一份,我们用了上线不到一个月,就收集到了300小时,两个月就是1000小时,非常快的速度,就发现语音的数据不是我们的平均问题,下步就是标注的问题了,语音收上来把头和尾剪掉,中间做成汉字,怎么做?讯飞有一栋楼,就是300号人在里面天天标,核心竞争力很厉害的,我们想办法,现在有两个道路,一个道路我们在天津开一个分公司也去标,另一条道路也琢磨未来有这个机会发给网民去标。我们知道谷歌做了一个事,一本书上就是要手写的或者英文单词,这个书怎么翻译,印刷体变成数字化,肯定不知道是怎么干的,他做了验字码的系统,这个验字码每次发给用户的时候,其中一半是从书上切下来的一小块图,另一半生成的东西就发给用户,用户填验字码,如果瞎填的话你过不了,你不知道哪半,可能左边可能右边,你只能老老实实填,只要正确的哪一半填对了,不认识的可以记下来,同时把这半的验字码发给好多人去标,如果三四个人结果都一样,那就标对了,这种方法就拼成一本书,就是让网民来干活,我也很好奇就是一个月两个月收集到1000小时,讯飞好几年才做到的。就是设法把网民的智慧,网民的表达吸取进来,不是靠自己去干这个活,就是给大家举个例子,我们做的事情都符合提到的智能的方向,这样能够降低对产品严重的依赖。

最简单的这些图,我们分了层面,用户利益点在什么地方,提供的服务在什么地方,使命在什么地方,用户利益点就是简洁的设计,快速、准确,安全等,提供的服务就是个性化智能的上网体验,我们吃过螃蟹,也知道里面怎么干,输入法、搜索引擎,大量的工程师懂得怎么学习,用统计方法解决智能问题,最后解决问题是让中国王敏表达的获取信息更简单,今天把智能的问题和搜狗的思考跟大家做个分享,现在把时间留给各位,有问题可以提。

刘兴亮:我给大家展示一样东西,大家掌声要更热烈一点带药来,在我看在微博上有一个用户留言,他本来是坐在倒数第一排了,听着听着回头看已经是倒数第五排了,后面有朋友是站着挺辛苦,下面进入互动环节,每位朋友最多可以问两个问题。

提问:搜狗输入法、腾讯输入法、谷歌输入法技术差不多,搜狗输入法核心在哪里?不能模仿一下做出来吗?

王小川:我觉得核心在几点上,早肯定是一个优势,我觉得有两条重要的地方,第一个是从组织管理上,我们重视程度比他们高很多,我们遇到什么问题,该加人加人,该推渠道推渠道,搜狗输入法是100多个人的团队在干。举个例子来说,大家知道在07年的时候谷歌推入输入法出现了抄袭门的事件,为什么呢?他们都是兼职学生在干,然后干一半两个问题,第一个我们遇到词库,当时发现纯粹用技术算的时候,有可能搞不定,那我们会关注有什么困难?怎么解决?靠人吧招编辑比较好,那就招编辑吧。谷歌可能不是,谷歌老大在外面晃,兼职工程师也没有资源和权利招人,这个问题解决不了配置不全,只好抄袭你的东西。然后上线前学生还要去做论文,这样的话重新一靠编辑就发了,也不知道什么东西,这种重视程度在里面的关注度也是非常重要的地方。第二是我们一直在主导这样的创新,新我们做的云的输入法,有两个原因,一个是服务到客户端的云,还有一个页面上访问一个网页,在硬件上没有装任何的软件的环境里面装搜狗云的输入法,我们会做人们的模式,我们是数百项的状态,还是马不停蹄领跑的位置。从团队的创新精神到公司的投入,其他的两公司是赶不了的,我们的重视程度肯定比他们高,这种情况下起的又早,资源又多,团队也优秀,这种情况下竞争对手是很困难的事情,唯一的问题就是当时腾讯采用的恶劣手段,就是捆绑,输入法捆下去就成默认,你抢过来了再改过去,这事干过跟他沟通过,后来又个著名的大干之后他就不干这事了,发现你不是他敌人,这时候跟重要性是有关系的,这方面不行,那方面也可以感,现在属于挺和睦的状态,如果再延伸一层就是你沟通信任也是有关系的,核心是品质和重视,从往下看品质看你的团队,从往上看公司的需求和重视度。
回复

使用道具 举报

5#
 楼主| 发表于 2012-3-1 21:13:12 | 只看该作者
刘兴亮:搜狗团队能够有今天也不是浪得虚名,从另外的角度说搜狗也要感谢一些他们。

王小川:其实我想通了有他没他一样,有他的话他帮我,没他的话我的浏览器早就大很多了,所以想通了就跟他没啥关系了。

刘兴亮:对他是爱恨交加。

提问:我是来自于联想,我想请问的问题是关于智能互联网的,您提到的第四部分还是有一些计划,我这个问题两方面,第一方面现在包括个公司业务相关的,像阿里云或者是百度等等,也会通过一种PC端往智能操作系统上扩展,甚至做硬件的定制,从这种业务关系来进,搜狗在这方面有什么计划?或者您对这方面他们这种上下游全占领的措施优劣您评点一下。

王小川:这属于挂羊头卖狗肉了,说智能其实你这个问题跟智能没关系,最后有关系的是智能机。

提问:请您对业务的行业形态发表一下见解,现在还没有看到搜狗做相关的动作,市场上容量是有限的,如果搜狗不做,可能是说用户的渠道,被别人占了,那就没有了,有一些什么相应的对策没有?

王小川:今天在无线行业发展的时候有两个话题,一个是谁有优势进去,第二个是怎么去布局,有两家半是最有优势的,一家是淘宝,一家是腾讯,还有半家新浪微博,他们把用户和服务迁移到手机上去,我用QQ用PC的,我用手机非常平稳的过去了,淘宝也是购物的时候就过去了,新浪微博也是,这是第一类企业。第二类会艰苦一些,把品牌和技术带进去的,我这个东西在PC上也用,但是在手机上你发现要重新布局重新打基础,这里面的公司举几个,比如像百度,百度也是手机上单独做,搜狗的输入法单独搞,360安全卫士单独搞,这是第二类。第三在PC没啥基础,利用无线行业里面从头拔起。第一类是最容易的,第二类比较累,因为有些地方跟PC是一样的,有些地方又不一样,你得把一样和不一样取得一个平衡才能做好。第三类死亡率非常高,就因为你的PC没基础,在这个领域里面,容易成功的就是做游戏了,就是明确的商业模式,剩下有一些搞不好会做成共享软件,跟PC是一样的,做个天气预报我想半天这事挺困难的。

首先有三类,你提到的布局是第一类公司,他已经拿到传票了不妨多做一些事情,这样会有一个布局的方式。我们之前有一个词叫开放,一直在很多低调的场合讲开放不是什么好词,有时候开放是好事,有时候开放是坏事。什么意思?当一个行业竞争到很激烈的时候,你通过开放重新改变产业链的模式,重新提高你的效率或者竞争,这是开放解决的问题,当一个市场在初期百废具兴还有原生态的时候,这时候就做封闭。在无线行业里面,几个公司配合起来解决一个问题是做不到的,我给大家打个比方,在无线行业之外,或者在互联网之外,原来有一个行业,一开始是做封闭的,但是随着这个行业越来越发展,用户越来越多,开始封闭的那些公司就倒闭了,反而这个行业继续发展是开放公司重新洗牌获得这样一个位置,好多人听我说过什么是PC行业,PC最开始就是四大家族就是IBM,然后到DEC一个叫王安,现在我听到的就剩一个公司就是IBM,人家不干PC了,王安早就挂了,一开始做开放做不成,做CPU也没戏,那会就得从内存、CPU、显示器所有的事自己干,因为没有人跟他搭配干这个事,上下游不成熟。随着行业的发展到后期的时候,竞争越来越艰巨,假设王安的CPU造的不好就会挂掉,这时候他就会说CPU用别人家的。如果说这个键盘只做CPU,只做操作系统,就不是这些公司了,从纵向的产业结构走向横向的产业结构。

今天互联网的PC端是走向这个阶段,大家看开放看我干的活看输入法、浏览器,哪个东西都不是大家要的,它不能解决所有问题,一定要把浏览器、输入法、网站、游戏搭配起来,才能解决问题,这是一个切入方式。手机里面今天你知道你只做一层搭配不起来,手机上流量抢的很厉害,这些客户连网站上都没建,所以就搞了一个团队,帮大家建网站,这是你发现说你是做一段的时候,没有人跟你配合起来,这种情况下做封闭,就是大家族做封闭就有他的优势,就是手机从头到尾一个完整的体验,这里面做的最极致的就是乔布斯,大家读乔布斯传会知道这事,乔布斯传一个是他的封闭一个是他的创新,他只有在封闭的环境里面,才能把创新做的极致,如果开放环境里面只做一层,其他事别人提供就做不到了。所以乔布斯嘲笑安卓,在安卓上做软件会测20几个平台的版本,甚至现在都不止了,屏幕大的小的,什么东西都可能问题在,而测苹果的MS就测两个,今天市面上发布的,未来要发布的,通过封闭系统才能够快速的推动创新,把产品的体验推到客户想要的。

今天做的搜索引擎,今天做的浏览器还会产生变局,每家做全产业链的事情会很累,小米就非常累,做手机、硬件、渠道、售后,软件兼容性,前段时间我发一个输入法的版本跟他兼容性还不够好,给雷军打电话,他说帮你背黑锅了我说是,你要去完成一个完整产业链怎么负责,你责任很大,但是做到的话回报很大,但是做挂掉的可能性也很大。只是对大公司而言,到这个度了,就该去干这个事情了,这是我对大环境的一个理解,试图理解开放封闭,以及理解到传统公司三种姿态的进入,把服务进入,把品牌进入,或者没有优势进入的,这是这个话题。

因此对搜狗的布局,今天你看到在无线里面很浅,我们只有一个先前部队就是输入法,如果顺利我们会推出更有影响力的产品,好多人说你们做不做手机浏览器,我说不做,不是不储备浏览器的技术,但是我不会把它当成一个单独一个产品来发布,因为你上下游连接的你的体验是保证不了的。因此我们会把语音技术、浏览器技术合成一个系统,去完成提供这样一个服务,不是说搜索引擎,浏览器、输入法分层发布的,只是把这些东西做的更封闭,我们没有做操作系统的计划,但是我们试图在力所能及的范围内把我们各种优势的整合在一块。我们做的表达获取更简单,其实里面有输入的概念,有搜索的概念,合成一个新的产品,在今年内会面世。搜狗的情况不像腾讯这么多钱,生孩子都不叫养猪了,就跟鱼下蛋似的,我们会保证这个成功率,没法在布局里面更广泛撒网,因此养一个孩子就得养好了,这是我们今天的方式,对我们的挑战也蛮大的。

刘兴亮:谢谢小川老师的讲课,从一个硬件案例讲史条例很清楚的,如果退休以后想去大学当老师,我给你联系一下。

王小川:我有这想法。
回复

使用道具 举报

6#
 楼主| 发表于 2012-3-1 21:13:29 | 只看该作者
提问:关于搜狗输入法在手机功能上,现在电脑输入法,搜狗实际是占领优势,我不知道在安卓和IPhone是什么情况?目前输入法是非常新,但是目前看来只是在网页里输入,这个作用目前不是特别大,下一步搜狗输入法有什么计划?

王小川:手机现在这个系统,目前的状态搜狗属于领先的位置,但是百度追的挺猛的,可能有个渊源在。最早的时候,搜狗在搜狐集团的时候,手机输入法不是搜狗做的,是无线部门在做的。我们内部会出现一个团结重新融合的问题,这会使得我们开始起步会耽误一些时间,无线负责人输入法留下来了,人到百度去了,做百度输入法,有情节追的很猛,我们觉得我们还是处于一个占优的位置,往下团队整合好了,这种差距才能够拉开,会有不少人提到在手机里面QQ挺好用的,百度挺好用的,搜狗没怎么好用。这里面两个原因,一个原因是差距确实没像PC这么大,另外一个点就是大家对搜狗产生比较高的期待值了,其他人在领域里面超过一点点你可能就觉得东西好,另外一个例子就像搜狗的浏览器有高度的下载,我们在好多情况下文件小的时候,比迅雷好很多,但整体迅雷在整个下载比我们还是强,我们在用户调研的时候,用户就会觉得搜狗下载会比迅雷快,在局部领域里面,我们确实有一定局部优势,就会产生这样的判断,因为迅雷是第一品牌,大家觉得是该有的,只要体验比迅雷快,大家就觉得不一样了,而且明显就想多了,这是出现的一个状态,简单来讲就是处于优势,然后往下还会拉的更开一些,现在在手机里面的位置,第二个是提到云的输入法,往下有什么更大的想法,在PC里面老实讲我的心思是放在探索引擎里面,希望在这里面有一个扩局,手机里面的输入法还是跟语音相关的,所以有两个半竞争对手在,一个是百度还有半个是讯飞,能把我们收集的大量数据训练好,就有机会比讯飞做的好。

刘兴亮:我可以把IT龙门阵语音数据无偿的捐献出去。

提问:关于谷歌购物搜索问题,他是做失败了,搜狗有什么想法?第二是麦克版的输入法什么时候词库同步?

王小川:购物搜索的理解,有两个流派,第一个流派是便宜,我要更便宜的商品,第二种是希望提供更多的附加价值,在里面产生的导购,一个洗衣粉漂白效果怎么样,一个洗衣机到底怎么样,如果只是底价的话是搜索的问题,今天是纯属可以干的,如果从一个导购角度来说难度会大很多,因为这不是技术话题了。我会认为购物搜索需求不大,我们把产品分成两类,第一类是标准化产品,第二是非标产品,非标产品比价就会变的非常困难,所以比价不是最关键的环节,标准产品会形成一家通吃的局面,像亚马逊也是,3C的标准产品会形成一家通吃,这时候比价会下降。价格这个事情不构成关键点,并且比完之后,如果说是商家不一定喜欢这事,可能是做事情有附加价值,就是这个附加价值也不高,对商家没有意义在。购物搜索在这件事情里面不会做出特别大的生意,一淘咱们多关注一下,我了解他们一天也就是四五十万,我觉得需求和满足都成问题。

刘兴亮:这么说一淘就没必要做下去了是吧?

王小川:这是你说的不是我说的。

提问:用户系统怎么建立?第二总会有相似的产品,怎样让您的产品做到有些东西是人无我有,让客户离不开你的东西?

王小川:我们想过用户系统了,以浏览器做公益性的东西,用户系统是不大的。输入法的词库这个需求很不旺盛,浏览器是接近于10也不大,确实挑战是做工具的时候,很难把用户系统带进去,这个问题到现在为止,没找到什么好的解决方案。我们解决一部分问题,个性化能做了一些,比如你做浏览器,我帮你订阅不同东西,遇到问题可以给你做弹窗做提示,我们可以干不同这种事,个性化不妨碍,用户系统到目前为止,还没有建起来,这是第一个问题。第二个问题提到跟竞争对象有什么样的优势的建立,我觉得还是跟服务做更多的连接,我们往下其实做了很多创新的东西,输入法优势还挺大,一部分在专利上我会加强了,视频截取这种东西我要做一些保护。另外还会考虑几个事情,一个是服务连接,跟服务连接跟做系统是比较难展开的工作。就是三个事,一个是知识产权的保护加强,第二跟服务性的内容性系统连接,也是尝试的方向,第三在核心品质上还是有空间改进的。在浏览器里面,我们会推出一个浏览器叫秒开,就是点页面的时候瞬间打开,这是第三个工具本身的增强,从这几个维度里面做出突破性都挺难的,这是现实的状态,还有就是不断增加小功能,满足大家智商变低的无穷需求,这里面这三个维度去展开。输入法已经很大了,三大客户端就是这三家,搜狗、腾讯、360,浏览器面临的问题还是不断提升这个事更关键,其次才是知识产权,以及秒开这些服务,老实来讲不够本质,如果浏览器增加了探索引擎模块,对接好了大家会更爱这个浏览器,这件事情会明显很多,但是他给你的终端性会给你带来一些顾忌,我们做的模块已经挺危险的了,就是考虑系统跟现有的品牌不一定衔接起来,因此PC里面,能够让大家兴奋的东西还是要讲探索引擎内容服务,工具的东西就是一个点一个点去嗑,没有好办法,无线反而好办,因为服务跟你的工具是联系在一起的,容易撕开一个口子,这是困局和部分的解决方案。

刘兴亮:考虑到王总IT龙门阵有史以来第一个带药来参加的,我们今天可能要提前结束,我们最后两个活动问题,最后两个你来选一下吧。

王小川:离我最近那个。

提问:王总你好我来自搜狐,随着智能互联网的发展,你也提到了产品经理,关于产品经理在智能互联网发展过程中,应该如何调整自己跟团队的位置,同时如何改善自己的知识结构?

王小川:这个话题实在是太复杂了,而且我没有成功的案例,我今天讲的东西都属于做成了,或者别人做成了我分析清楚了,你的问题是属于怎么跟老板相处好,这么一个问题在。我觉得一条产品经理肯定不会失业的,他还是占据了把握用户需求王道的地方,用户要什么他是该想清楚的,这是他继续加强的地方。他的难点是在于说怎么满足,他懂得用技术是可实现的,我们有些时候会发现说产品经理觉得这事做不了会放弃,一种情况下是技术工程师觉得做不了就放弃,我觉得更大胆的去想,更执着的技术,要么就是特别懂技术,要么就不懂技术,这半通不通的,以为自己懂技术,跟他聊半天结果发现走偏了。因为两个极端,一方面就是忘掉技术本身,从客户需求着手,另一方面是跟工程师做到非常好默契的沟通交流。一个好的产品经理不是说你做到什么样,而是说谈到了一种理念,使得工程师面对两个规格的时候,工程师知道哪个规格是大家想要的,比如说拿瓶水,还是说我跟你讲一个我要的东西以后,我拿出10瓶水来,工程师就知道哪瓶水是我该要的东西,形成这样的一个默契,才能把这个缝隙弥合好。刚才说了两条,一个是自身行为在技术里面忘却掉,第二个跟技术更好的搭配,除非技术人员转型到做产品,可能能够自己全部搞定,但是难度太小,工程师技术人员对这种理解还是非常非常少的。我最近见了一个公司掉坑里面,这个公司发完财报,号称要做推荐引擎,找了一个从百度出来蛮顶尖的工程师,帮他搭推荐引擎,还投资入股,但是双方搭配不好,因为他对产品需求不了解,在那个阶段里面推荐引擎,核心靠的不是学习这一套,而是靠一些分类体系或者其它一些算法,所以这个公司后来说要在年终推出来,现在还没有声音,这就是产品核技术之间衔接的困难。

刘兴亮:哪个公司?

王小川:我不能告诉你很大。

刘兴亮:我猜一下猜不到。

王小川:就是号称要做推荐搜索引擎的公司。

刘兴亮:几个数字是吧?

王小川:你说的不是我说的。

刘兴亮:我们最后一个问题。

王小川:我找个女士吧。

提问:我特别喜欢小川总,我知道他在这讲座,我就过来听一下,我听说他嗓子不舒服我就买了喉糖。

提问:我的问题很简单,您提到智能搜索引擎,您会把之前搜狗的网页作为重要依据吗?

王小川:今天谷歌在里面都是三层不到的用这个东西,这是行业整体有更多的参数加进去做这个计算。

刘兴亮:小川总还有什么要分享的吗?

王小川:我觉得今天抱歉嗓子不好也不是什么大不了的事,我前几天也没吃药,就想今天过来中午买个药就当被一个事了。

刘兴亮:没事的话再把东西送给人家。

王小川:我会对大家负责,所以我会把这个药用上。

刘兴亮:谢谢小川谢谢我们在场的各位朋友,我们下周二再见。
回复

使用道具 举报

gallopgazelle 该用户已被删除
7#
发表于 2012-3-13 14:49:20 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

Archiver|手机版|小黑屋|教你搜 ( 鲁ICP备16006309号

GMT+8, 2025-5-30 16:01 , Processed in 2.109320 second(s), 21 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表