最近,百度新上线了一项查生僻字的框计算应用,面对不认识的生僻字,网民不用输入这个字本身,而是只需要向搜索框提交对字形和结构的描述,例如上文中的“三个雷”、“
男女男”,就可以直接检索到这个字的准确读音及注释。
这项应用看似简单,实际上,却标志着百度的框计算已经突破了针对完整文字进行匹配的传统检索时期,进入了更加精准、智能和人性化的语义搜索时代。
什么是语义搜索?
顾名思义,所谓语义搜索,是指搜索引擎的工作不再拘泥于用户所输入请求语句的字面本身,而是透过现象看本质,准确地捕捉到用户所输入语句后面的真正意图,并以此来进行搜索,从而更准确地向用户返回最符合其需求的搜索结果。
举例来说吧,当一个用户在搜索框中输入“孟字去掉子”时,深谙语义搜索的搜索引擎就能够判断出,用户想要找的并不是含有“孟”、“去掉子”等字眼的内容,而是想要查找与“皿”这个字相关的内容;同样,当用户搜索“表现春天的图片”时,搜索引擎会向其呈现出各种与春天相关的图片,而不仅仅局限于该图片的标题是否包含“春天”字样。
语义搜索的实质是自然语言处理技术,这正是百度自推出框计算概念以来一直重点投入的研发领域——早在去年,百度就曾与在该领域非常权威的哈尔滨大学建立联合实验室,着手自然语言相关技术的研发。
我们有理由相信,对于百度和框计算来说,此次的生僻字查询功能,只是其语义搜索相关研发进程的一个小小成果。或许用不了多久,网民们所提出的诸如“听起来很温暖的歌”、“带有海豚音的音乐”、“家乡的新闻”、“适合我的女朋友”等形形色色、千奇百怪的问题和请求,都将能从百度的框计算服务中获得最好的解答。