人工智能的核心:深度卷积神经网络&深度强化学习
什么叫人工智能?迄今有许多定义。智能这个词已经变得很大众化随处可见,那什么是真正的人工智能?这个问题比较大,但还是可以说清楚。
人工智能也就是人造的智能。意识不是人造的,其中的自我意识可感知整体的自我,并与自我之外的环境清晰分隔,是“生命存在”的主要体感。意识的物质基础仍然是生物神经元及其脉冲编码,是遍历整合大脑中各功能模块、皮层各通道之巨量神经回路集体投射的结果。
换句话说,现在复兴的人工智能更多仅限于最底层的,比如说视觉、听觉的目标分割(定位)与识别部分,而且还完全有别于生物智能,是一种“大数据智能”。超人类水平的AlphaGo属于博弈类决策,但也只是模拟了人与动物的强化学习方法,并且依旧是建基于大数据深度学习之上的。其他更高级的“认知智能”和“创造性智能”,人类大脑是怎么做到的,有什么原理?我们现在还知之甚少,就更别提模仿了。
如果说人工智能接近于人类水平——达到或超过就更不用说了,那我们就可以说它是真正具有智能的。把简单的逻辑判断称之为智能显然是不科学的。毕竟接近于人类水平的人工智能技术更具应用与商业价值。但在现阶段的所有算法中,只有大数据驱动的深度卷积神经网络,还有深度强化学习,就某个“点”的特定应用场景来说,确确实实达到了人类水平,甚至超过了人类水平。这两部分目前是人工智能的核心,可以做产品开发和产业发展,但同样这两部分本身也有许多缺陷。
深度卷积神经网络现在涌现出许多极其成功的例子,包括人脸识别等;基于深度强化学习的 AlphaGo 也打败了人类最强围棋冠军;Facebook发布的神经机器翻译系统仅用了纯粹的深度卷积神经网络,不仅翻译准确度进一步提高,而且翻译的速度还大幅度提高了九倍。第三次人工智能的复兴不是虚幻、不是泡沫,而是实实在在的进步,至少有深度卷积神经网络和深度强化学习这两个革命性的进展,尽管算法仍不完美。其他的前沿技术目前还在探索之中。
人工智能那些未来发展之路
展望前沿技术探索,未来三到五年最有可能出现突破的就是半监督的学习方法。现在深度卷积神经网络很好,但是它有缺点,即依赖于带标签的完备大数据,没有大数据喂食就不可能达到人类水平,但是要获得完备的大数据,需要付出的资源代价太大,很多应用场景甚至得不到,比如把全世界的火车照片都搜集起来,这是不可能的事。我们希望能够做一些小数据、小样本的半监督学习,训练数据不大,但是还能够达到人类水平。
我们做过很多实验,人为地去掉一半甚至去掉1/4的标签数据去训练深度卷积神经网络,希望网络能够具有举一反三的能力,通过小样本或小数据的学习同样能够达到人类水平。这方面的研究不管是利用生成式对抗网络,还是与传统统计机器学习方法相结合,或者是与认知计算方法的结合,证明难度都挺大。比如我们看到了土狗的照片,从来没见过藏獒、宠物狗,但通过举一反三就能够识别出来。这靠什么?靠推理。人类不完全是基于特征提取,还靠知识推理获得更强的泛化能力。而现在的深度卷积神经网络是靠多级多层的特征提取,如果特征提取不好,识别结果就不好,就达不到人类水平。总之,特征提取要好就必须要有完备的大数据。但不管怎样,相信具有“特征提取+知识推理”的半监督或者无监督的深度卷积神经网络三到五年会有突破,而且还是基于端到端学习的,其中也会融入先验知识或模型。相对而言,通用人工智能的突破可能需要的时间更长,三到五年能不能突破还是未知,但是意义非常重大。
在半监督、无监督深度学习方法突破之后,很多行业应用包括人工智能场景研发都会快速推进。实际应用时我们一般都通过数据迭代、算法迭代向前推进。从这个角度来说,AlphaGo中体现的深度强化学习代表着更大的希望。因为它也是基于深度卷积神经网络的,包括以前用的13层网络,现在用的40层卷积神经网,替代了以前的浅层全连接网络,带来的性能提升是很显著的。
为什么深度强化学习更有意义?首先它有决策能力,决策属于认知,这已经不仅仅是感知智能了。其次AlphaGo依赖的仅仅是小数据的监督学习。3000万的6-9段人类职业棋手的棋局,对人类来说已经是大数据了,但对围棋本身的搜索空间来讲则是一个小数据。不管柯洁还是聂卫平,都无法记住3000万个棋局,但19x19的棋盘格上,因每个交叉点存在黑子、白子或无子三种情况,其组合数或搜索空间之巨大,超过了全宇宙的粒子数。对具有如此复杂度的棋局变化,人类的3000万个已知棋局真的就是一个小数据,AlphaGo首先通过深度监督学习,学习人类的3000万个棋局作为基础,相当于站在巨人的肩膀上,然后再利用深度强化学习,通过自我对弈、左右互搏搜索更大的棋局空间,是人类3000万棋局之外的棋局空间,这就使AlphaGo 2.0下出了很多我们从未见过的棋谱或者棋局。
总的来说,深度强化学习有两大好处,它寻找最优策略函数,给出的是决策,跟认知联系起来。第二,它不依赖于大数据。这就是前面说的小数据半监督学习方法。因为在认知层面上进行探索,而且不完全依赖于大数据,因此意义重大,魅力无穷。相信深度强化学习非常有潜力继续向前发展,将大大扩展其垂直应用领域。但是它本身并不是一个通用人工智能。AlphaGo只能下围棋不能同时下中国象棋、国际象棋,因此还只是专注于一个“点”上面的,仍属于弱人工智能。
实现通用人工智能,把垂直细分领域变宽或者实现多任务而不是单任务学习,对深度神经网络而言,沿什么样的技术途径往前走现在还未知,但是肯定要与基于学习的符号主义结合起来。通用人工智能现在没有找到很好的线索往前走,原因一是因为神经网络本身是黑箱式的,内部表达不可解析,二是因为传统的卷积神经网络本身不能完成多任务学习。可以考虑跟知识图谱、知识推理等符号主义的方法结合,但必须是在新的起点上,即在已有大数据感知智能的基础上,利用更高粒度的自主学习而非以往的规则设计来进行。另外从神经科学的角度去做也是可能的途径之一。
前面说过,我们可能需要从隐含特征的学习迈向隐含规则的学习。对于经验性规则人类是通过自主学习获得的,不是靠人工设计。例如一名司机从驾校毕业到开了几十万公里里程变成很有经验的老师傅,整个过程其实是通过“试错式”的长期实践或强化学习得到的,驾驶技巧或规则被模糊分割得越来越细,对极端与紧急情况的处理,也拿捏得越来越细腻与及时,但是这些代表经验或知识的规则显然是隐含的,只可意会不可言传,很难被人为地总结成基于显式规则的专家系统。而我们希望基于深度卷积神经网络和深度强化学习,与知识工程、概率图模型或与传统机器学习方法相结合,在更高的粒度上进行学习,实现隐含规则的自动学习以及更高知识粒度的学习推理。从某种意义上说,认知水平的推理机制或能获得更强的泛化能力。例如,我们倒车入库的时候不是都靠视觉感知,如果后面因盲区看不见,我们就靠隐含规则推理,看车的后视镜跟侧方泊车差不多平行,不用感知智能,靠认知智能也能把车停得很好。
被人工智能取代? 你恐惧吗?
在这个“人工智能”爆发的时代,有很多人表现出对人工智能发展的恐惧,人们最为普遍的忧虑以及最为热门的话题始终是,它是否会造成大规模失业,是否会抢夺人类的饭碗?
过去20多年,我们已经先后感受过PC、互联网和移动互联网对我们社会的冲击,其实人工智能的冲击可能会更大。现在我们人手一台智能手机,相当于人手一台高性能电脑,随时随地就可跟地球上的另一个人联系,现金都不用带就可上街,这个变化已经很大而且已经成为现实。人工智能极有可能给我们的社会带来更大的改变,一些工种或职业可能会消失,但同时也会产生一些新的职业。
那些很短时间内能够完成、不需要深思熟虑或者仅依靠人类视听觉与简单脑力劳动就能完成的工种,确实很有可能会被取代,比如电话客服或者前台咨询员等,也有可能是长途货车司机,出租车司机,快递员,产线工人,金融从业者,翻译,会计,税务人员,审计人员,医生,传媒从业者,教师,司法从业者等。在移动互联网时代,人工智能掌握的资料和知识又多又快,它每天收集与“阅读”海量涌现的大数据,而人类由于精力的限制只能看到少量的碎片化信息,能及时消化的信息就更少;而人工智能则可以每天24小时不吃饭不睡觉,快速进行大量的基于深度学习的数据自动化处理,其时效性、规模性和实际产出等,肯定比人类好很多。
按我的说法就是,在马车时代,突然汽车问世了,你不用恐惧,新时代来临,也会产生很多新的工种。你当不了马车夫,但你可以去当汽车司机,也可以当个汽车售票员,还可以修马路、造汽车,这些都是全新的职业机会。随着人工智能的不断发展,由于算法的自主性与环境适应性提高,很多较复杂的体力劳动以及更多的简单脑力劳动,不需要人去做,这其实是对人类生产力的大解放。