机器学习的技术路径没错,只是还不够成熟


 

郑磊(国际新经济研究院数字经济研究中心主任)

 

    聪明的“阿尔法狗”和普通人的区别在何处?我的答案是:它是一个只会下棋的机器狗。普通人未必会下棋,更不可能战胜人工智能棋手,但是普通人能干的事情很多。从这个角度讲,任何一个智能机器都无法与一个普通人相提并论。

    日前对人工智能的议论颇多,作为金融投资界人士,我听的最多的是在人工智能项目上的投资热潮正在快速褪去。而从技术角度看,声称机器学习已经发展到了极限,人工智能的技术路径遭遇瓶颈的声音比较大。

    我并不这样认为。机器学习把人脑作为要给黑箱进行模拟,这一点应该和目前我们对大脑科学的研究进展相差并不算太远。脑科学现在也没能完全研究清楚人脑的思考技能,而人工智能也在深入发展神经网络算法,这些仍属于机器学习范畴。我们知道人脑有探索事物模式的习惯,人们通过不断接触和摸索实践,逐步形成了系统化的信息和知识。脑科学现在也无法研究清楚人脑是怎样形成这套知识体系的。机器学习采用的原理也是如此,在大量的相关数据里找出规律,而且我们也不知道机器是怎样找出的规律,作为一个黑箱,我们只是在观察机器最后做出的结果是不是足够令我们满意。

    如果我们把人脑和身体其他部分分开看,这就是一个内部结构异常复杂的“黑箱”器官(大脑各部分)与人体各个感知器官(大量的神经网络)的结合体。人的各个感知器官随时将接收到的外部刺激信号通过神经系统传递给大脑,由大脑进行选择性的处理加工,并给出反馈。人脑和人工智能机器学习的最大不同之处在于输入的数据是不同的。我们在训练机器进行学习以及让机器处理外部信息时,无论是训练数据集合和实际输入的数据,其实类型都是比较单一的,这和大脑每时每刻接受的信息是不同的,后者实际上是一种混合的数据,属于大数据。

    我认为人工智能的发展必然是朝着大数据智能的方向发展,而这必然建立在现有的机器学习技术路径之上。如果我们不站在这个基础上,大数据的机器学习就成了无根之木和无源之水。从事人工智能领域的专业人士应该了解这一点。这方面的书籍,我选择了一些推荐给有兴趣的朋友阅读。

    《智能计算系统》是中科院计算所在人工智能方面有深厚理论和实践造诣的科学家撰写的,是一本国内少见的从人工智能全局和整体结构入手,系统讲解人工智能从芯片、编程到算法实现的专著。本书适合大学水平的读者,通过一个有趣的项目将一幅图像转变为梵高风格的图画,帮助读者形成人工智能的系统思维和系统能力,了解完整的人工智能软硬件。读者可以从这本书开始入手。

数学基础较好的读者可以通过阅读《机器学习理论导引》,掌握机器学习的理论内核。这本书提纲携领地总结了机器学习的七个基本概念和重要工具,分章具体介绍了每个概念和相应的技术工具。这本书也可以作为手册,在需要了解相关概念和理论基础时查阅。对于数学基础较弱或者更希望通过动手实践学习的小伙伴,我建议阅读《机器学习算法的数学解析与PYTHON实现》。这本书每一章都用python编程实现了一种机器学习算法,之后用一章介绍了如何组合这些算法,通过编程学习人工智能的主要算法,也是一种卓有成效的方式。在学完这本书之后,可以再深入提高,学习《PYTHON深度学习:基于PYTORCH》。

机器学习的重点是深度学习,而神经网络是其主要模型,也是目前深度学习的核心。学习这方面的知识,可以阅读《神经网络与深度学习》一书。这本书与前面几本书在机器学习方面有重叠,但更多章节深入介绍了神经网络涉及的理论和算法,是介绍神经网络较系统的一部著作。《深入浅出图神经网络》介绍了神经网络模型的最新进展,即如何处理图数据(网络数据),这本书属于进阶的专著,可供读者选读。

人工智能未来必然会取得突破性进展,预计2040-2050年,人工智能将达到人类智能水平。在未来二三十年里,人工智能将会成为类似本世纪初计算机知识,成为人们日常生活中不可缺少的一部分。