机器学习是关于计算机基于数据构建模型并运用模型来模拟人类智能活动的一门学科。随着计算机与网络的飞速发展,机器学习在我们的生活与工作中起着越来越大的作用,正在改变着我们的生活和工作。日常生活中的机器学习我们在日常生活经常使用数码相机。你也许不知道,数码相机上的人脸检测技术是基于机器学习技术的!我认识三位了不起的科学家与工程师,他们是Robert Schapire,Paul Viola,劳世竑。他们三位都与这有关。R o b e r t与Y oav Freund一起发明了非常有效的机器学习算法A d a B o o s t。P a u l将A d a B o o s t算法成功地应用到人脸检测。劳世竑和他领导的Omr o n团队将A d a B o o s t人脸检测算法做到了芯片上。据说现在世界上有百分之六七十的数码相机上的人脸检测都是用Omr o n的芯片。在我们的工作与生活中,这种例子曾出不穷。互联网搜索、在线广告、机器翻译、手写识别、垃圾邮件过滤等等都是以机器学习为核心技术的。不久以前,机器学习国际大会(International Conference onMachine Learning,ICML 2011)在美国华盛顿州的B e l l e v u e市举行。约有7百多位科研人员、教授、学生参加,创造了历史最高纪录。大会的三个主题演讲分别介绍了机器学习在微软的Kinnect游戏机用户感应系统、谷歌的G o g g l e s图片搜索系统、I B M的Watson自动问答系统中的应用。这些事实让人预感到机器学习被更广泛应用的一个新时代的到来。机器学习与人工智能智能化是计算机发展的必然趋势。人类从事的各种智能性活动,如数学、美术、语言、音乐、运动、学习、游戏、设计、研究、教学等等,让计算机做起来,现在还都是很困难的。这是几十年来人工智能研究得到的结论。人工智能研究中,人们曾尝试过三条路。我将它们称之为外观(extrospection)、内省(introspection)和模拟(simulation)。所谓外观,指的是观察人的大脑工作情况,探求其原理,解明其机制, 从而在计算机上“ 实现” 人类大脑的功能。比如, 计算神经学(computationalneuroscience)的研究就是基于这个动机的。然而,人脑的复杂信息处理过程很难观测和模型化。就像我们仅仅观测某个计算机内的信号传输过程,很难判断它正在做什么样的计算一样。内省就是反思自己的智能行为,将自己意识到的推理、知识等记录到计算机上,从而“再现”人的智能,比如专家系统(expert system)的尝试就属于这一类。内省的最大问题是它很难泛化,也就是举一反三。无论是在什么样的图片中,甚至是在抽象画中,人们能够轻而易举地找出其中的人脸。