现任百度高级研究员的赵世奇博士,不仅是百度搜索业务群组技术委员会联席主席,还是中国中文信息学会青年工作委员会主任。他认为:“无论是百度的"框计算"所追求的"即搜即得、即搜即用"还是近来倡导的"连接人与服务",背后都需要自然语言处理(Natural Language Processing: NLP)技术来对用户需求进行精准理解、对互联网资源进行深度分析,以及实现需求与资源的语义匹配。因此自然语言处理是百度最核心的基础技术之一。”
百度的核心产品是搜索,而搜索的核心技术之一便是排序。来自百度的导师首先为学生介绍了搜索排序所依赖的机器学习模型,尤其是“学习排序(Learning To Rank:LTR)”模型;如何通过优化查询改写和匹配算法,以及引入深度学习模型来改善搜索结果的相关性;以及如何基于“用户搜索日志”,通过点击反馈模型来进一步优化排序效果。正如百度的导师在课上所说的,“文本相关性是远远不够的,用户说好才是真的好”。他的课程向学生展示了用户行为数据对于搜索引擎、甚至所有互联网产品的重要价值。