李德毅:新一代人工智能如何从传统人工智能中脱颖而出
来源:图灵人工智能
作者:李德毅 中国工程院院士、CAAI名誉理事长、主线科技首席科学家
【慧聪通信网】2021年4月10日,“吴文俊人工智能科学技术奖”十周年颁奖盛典在北京举办。颁奖典礼上,中国工程院院士、中国人工智能学会名誉理事长李德毅荣获“吴文俊人工智能最高成就奖”,成为这一最高荣誉的第三位获得者。李德毅院士在认知模型、智能控制、不确定性推理、数据挖掘、无人驾驶等方面取得多项国际领先成果,是我国不确定性人工智能领域的主要开拓者、无人驾驶的积极引领者和人工智能产学研发展的重要推动者。
在大会举办期间,李德毅院士也分享了自己对于“新一代人工智能的看法”。
以下是演讲全文:
我今天报告的题目是“探索什么叫新一代人工智能”。传统的人工智能怎么讲?新一代的内核是什么?能做到什么样子?
副标题为“人工智能100年”,也就是到2056年全世界新一代人工智能在我们眼里是什么样子。
1956年达特茅斯会议上讨论了七个话题,现在拿来看哪一个都不落后,那到本世纪中叶应该是什么样子呢?传统人工智能有什么技术表征呢?新一代有什么表征呢?中间的分界点在哪里?如果我们对这四个问题不认真地思考,整体用信息化代替人工智能,那我们就太粗放了,尤其是科技工作者必须坐下来仔细想一想,不要整天云计算、大数据、人工智能。
我们要沉下心讲一讲这四个问号怎么回答。
新一代人工智能
如何从传统人工智能中脱颖而出?
我个人认为这个分界点可以定在机器学习之后的深度学习事件上,由于人类的围棋高手都被一个机器打败,全世界一片哗然。2016年这个事件震动了政治家、心理学家、老百姓,当然也鼓舞了人工智能学者。它是由早期的机器学习,尤其由深度学习爆发而来。
但深度学习是不是就是新一代人工智能?我把它作为分界点,传统人工智能是什么?为了方便我发明了一个词——计算机智能,凡是在计算机上玩智能的(算法、大数据等等),那都是玩的计算机,不算新一代,而是传统智能。
算力就是搞计算机,那是计算机本来就应该干的事情,算法是人力工程师应该干的事情,数据就是应用。我们不能满足于算力、算法、数据起到的最大作用,要探索新一代人工智能。
新一代人工智能起名很难,有人说叫类脑智能,这个人类最喜欢了,因为人类之所以成为身份链的最高端就是我们有一个聪明的大脑。但脑科学不是一两年的事情,在脑科学没有搞清楚之前我们能不能做类脑智能呢?
现在作为人工智能最顶端的就是GPD3,因为大量算力、算法来做预训练、预编程,我们清华大学在花很多力量做汉语的预训练和编程,将来自然语言处理,比如生成报告、小说、诗歌,这些都可以在机器上看得到。这些预编程、预训练难道就是我们要的智能吗?我觉得我们要的是会学习、智编程的人工智能。
什么叫会学习?智编程,我们要把软件工程师、算法工程师用智能表现出代码,让机器自己写出来,类似人脑的智能。为了说清楚这个问题,我愿意讲讲三次认知革命,第一次是五千年前人类发明了语言,尤其是发明了文字。
所有生物能有自己文字的只有人类,文字是脱离生命体智能,可以把知识,文化承载下来。有了文字才有文化,有了文化才有文明,所以这几年我一直讲两句话,智能植根于教育,文明是智能的生态。500年前人类科学技术革命大发展,认识客观事件,发明了大量蒸汽,电动一直原子,这些动工具延伸了人的体能,解放人的体力。
100年前开始认识生命科学,发明人工智能。我们要用人工智能来延续人的智力,这三次革命很值得人们回顾。现在有人想做人工生命,这件事情要小心,如果人类要培养一个新人类,我们人类不会那么做的。所以要搞清楚意识,搞清楚生命,这是未来的事情,不是当前的事情。我们要研究人脑组织结构进化和后天学习这两件事情,因为它成就了人类的智能。遗传基因和可塑性就是我们讲的机器带有东西可以学习,一个什么软件都没有的机器不可能学习,后天怎么学?大家知道人类的智能和其他生物相比,如果没有后天的学习是不高明多少的。
我得出一个新的定义,智能是学习的能力,是解决问题的能力。学习又是解决问题的基础,学习可以很多。学习的结果是记忆,这句话很重要。我们不但要研究计算智能,还要研究记忆智能。解决问题是学习的目的,不能用一台机器总是做它原来能够解决的问题,我们希望解决它从来没有遇到过的新问题这是我们要追求的。这里面怎么解决?用数学家语言来讲,怎样把一个设计问题基于高阶次来做,把小变量放到一个大变量范围内研究才能够解释,解决这个问题。我个人认为算力算法和数据仅仅是计算机智能的硬核。
为什么这个事情这么强大?这不是偶然的,可以看看这张片子。每一个理工男都知道微积分,后来波尔做了逻辑代数成就了计算机,后来Fraga提出了位置演算。有人在有限数学资源里面怎样表示无穷的数学能力,打破了人们思维传统界限。有人提出了23个数学难题,后来哥德尔提出完备性定理,最后出来的两位神,就是图灵和伊曼两位专家,他们不但是人工智能之父,而且也是计算机之父。
图灵模型是在1936年发表,在1945年提出自动计算机,1950年他成为人工智能之父。他写了一篇重要文章《计算机器和思维》,冯洛伊曼先生用冯洛伊曼五个要素形成一个实实在在的物理机器,这叫计算机,所以智能科学的发展就是不断地提出智能问题,确保智能可解释性,引起了数学危机。再证明,让这个封闭性圈子越搞越大。
因此我们现在遇到一个基本问题就是开放性跟封闭性的矛盾,可以无限接近真理,但永远不可能相同它。人工智能科学家或者认知科学家这40位学者获得的诺贝尔奖和图灵奖,可以看到他们是怎样来做智能和人工智能研究的。1978年西蒙拿了经济学诺贝尔奖,同时在前一年又拿了人工智能图灵奖,这是我们的楷模。
现在说类脑智能,确切说应该是受脑科学或者认知科学启发的人工智能。并不是要在一个机构上做出真正类脑物理脑装置,而是受启发的。我们要认真研究怎么启发,受了哪些启发让我们能够做新一代智能呢?就是人工智能工作者要认真研究的对象。
我们不但要类脑,还要类人,还有躯体的智能。能在物理装置上重现人类智能,受脑科学和认知科学启发新一代人工智能架构,就是了解新一代人工智能的四梁八柱才是人工智能科技工作者追求的方向。
利用类脑人类发明了飞机,反过来用空气动力学解释了鸟的滑翔,鸟在飞行当中的动作还是很多的,不能全解释。利用类脑人类发明了计算机,反过来用计算智能解释了人脑部分智能。类脑,类人之路还很长,我们不能太急躁,不能太浮躁。
到底启发了我们什么呢?为什么我们可以做这些事情呢?我列出五条启发点,每一个都很重要,围绕这五条孵化了才可以。回顾人工智能70多年发展,我们有三条主线,一个行为主义机器人学派,他们提出机器如何像人一样行为。一个是符号主义,这是人工智能的主流学派,我原来在英国读博士的时候,我做的是位次演算,位次逻辑。他们强调的是机器如何像人一样思考,于是我们有了推理,预测可解释。现在大家比较看好的就是研究主义,尤其是人工神经网络然后出现了深度学习,尤其是转接学习。
机器脑如何像人脑一样连接,今天当我们研究新一代人工智能时候我们发现这三个学派封闭型假说都要被打破才行。于是我们从行为主义者强调模仿和类比,人类的模仿是人类抽象思维第一个功能。从行为智能得到感知智能,计算智能强调模型驱动继续发扬计算智能。从连接主义里面强调要考虑语境,语用,语构,语法四要素。人类智能进化先低阶后高阶,第一阶认知产生了感知智能行为智能,高阶认知产生记忆智能和计算智能,而人工智能恰是相反。我们先忠于符号计算,第一阶认知一直很弱必须大大加强。我搞了这么多年无人驾驶,本质上是搞的跨模态感知智能,认知用得很少。因为激光雷达跟毫米波雷达和摄像头搞不好跑不起来的。
人工智能不是人造生命,生命是人类存在的底线,触碰底线要慎之又慎。为什么要剥离意识呢?因为上海这个地区对伦理很重要,我多谈一点为什么现在当前不急于做人工生命的原因。意识这个问题,所有哲学家都感兴趣。计算机已经成功把智能和意识剥离了,计算机没有意识但它有智能,因此我们可以继续做没有意识,有智能的高阶机器。非生命人工智能可以确保一以贯之的工具性,智能体外延伸才是人类最需要的。
汽车成为我们的工具,就是人类的第一杀手。这个第一杀手之所以产生就是人类意识造成的,因为它疲劳,它有情绪,思想不集中。我们要这个意识干什么呢?我们只要意识不要智能,如果要意识,对不起这条路很长。意识可以分成三种,自觉意识,自我意识或传递意识。自觉意识需要当前人工智能学界做出一个人造的皮肤,把机器人包裹起来,让它能够感知到自我,皮肤功能很强大。到哪里找到这样皮肤呢?人全身有1000亿个上皮细胞常常更新,可以再生,体内还有15万公里总长的神经,这样人造皮肤到哪去做?如果没有,谈什么意识呢?我建议大家先做工具,不要做意识。
当前情况下做一个受脑科学启发的人工智能,一定要拿出一个非冯洛伊曼架构出来。在监管上类似人脑的神经组织,这个机器放到这个地方应该能感知到周边的环境,在智能驾驶里面叫做同步定位和映射。新时代人工智能价值,我提出两个循环,两个协同。一个是客观事件跟内部循环,通过五个感觉,感知器官。还有就是躯体的循环,形成动力学行为。内部还有两个协同,工作记忆跟场景记忆协同,记忆跟计算协同。
我们不要把所有机器都搞成CPU为主,可以数据中心为主,让CPU加速。只有在计算里面才有CPU为主,让GPU加速,不要所有芯片都是CPU为主,能不能做到这一点呢?我们还要有一个知识图谱,用快速和慢速双驱动形成对记忆的提取。把记忆提取做出来,在人工生命里是一件很伟大的事情。
新一代人工智能的核心在哪
第二点讲一下会学习,这个是新一代人工智能的核心。
现在所有计算机都是软件工程师的智能编程的代码在一次又一次简单执行而已。我们希望这个机器在学习过程中能够解决新的问题,这才叫做新一代人工智能。因此找它的边界怎么找呢?学习形态是交互,学习核心是理解,学习结果是记忆,学习成为新一代人工智能解释解决现实问题的基础。记忆智能成为新一代人工智能中多领域,多情景可计算智能的边界和约束。
用语用,语境来约束语义和语法。机器在客观空间里要有位置感知能力,形成位置空间感,为什么不讲多模态呢?因为我觉得视觉和听觉,哪怕是双模态已经很丰富了,不在于多而在于互相之间交叉融合,就是我们讲的信息融合,信息冲突更多一点,怎么样做冲突消减才是我们认真要做的事情。
这里面涉及到一个很基本问题,到底用没有通用智能?我认为人类学习过程中是不可以划分通用和专用,也不可以划分什么叫常识,什么叫非常识。
AlphaGo不是专用要是能把不同棋盘都能下,把游戏规则稍微改一下那个在专用里面也叫通用,这就是我的基本观点。相对地不要刻意区分,归根到底是人的魔法,魔法当中最重要是抽象,类推,类比。所以怎么学呢?我提出了三种学习方法,一个叫做课堂学习,一个叫做仿真学习,一个是真实环境下的学习。
假如我们做这样一个无人驾驶,机器人向人学习。像特斯拉一样还是你开,你开了两年之后这个驾驶脑说可以开了,就是第二阶段,机器开车让驾驶员干预一下。到了一定时候机器人学会了它说我不但可以从虹桥到苏州,我可以叫所有汽车都从虹桥到苏州,机器人叫机器人,这多好。这里面最重要的是怎样形成知识图谱,我们提出一个记忆网络的想法。用数据化,网络化来做这件事情。
我们知道神经元是一个超大规模的网络,怎样挖掘知识,进行基因提取我们正在做这方面的工作。我们希望通过学习让机器自学语言,让机器人听一听课,他有语言能力,有听觉,有视觉,还有手可以做表示,利用它的交互能力去学习去提问,学了一年两年能不能让它自己写一个新的程序呢?这就是我们自己推崇的。
机器人需要依赖自身软硬件和外部变化的环境,通过交互学习和记忆实现自编程自成长。机器人也许无法改变自身研发或者基础软件,如同人无法改变自己的基因一样,可以通过自编程扩充自己能力,也可以通过交互提出扩充硬件或者基础软件的要求,让它的主人配合它更好的增长才干,适应环境增长。行为主体一定是人类,我们提出两个驱动,情景数据和自身模型,归纳和研究系统推进,理性和经验迭代发展。
到2050年最浪漫的事也许是新一代人工智能和人类一起与时俱进,一起学习成长,解释解决新的问题,今天的手机以后将变成可交互,会学习,自成长,个性化的个人代理。
传统人工智能是计算机智能,应该是封闭型人工智能。新一代人工智能应该是开放性人工智能,传统人工智能应该是算力算法和数据,新一代人工智能是交互学习和记忆,传统人工智能解决的是确定性问题,我们要解决的是不确定性人工智能。