Jeff Dean与谷歌
问:能不能先和我们讲一讲你刚加入公司时的情形~
Jeff Dean:那时候公司很小,在Palo Alto一栋二层办公室里。我们有一张乒乓球桌和吃不完的东西。在那兴奋和充满活力的日子里,我们怀着改变世界的心情研发一款如今人人都在用的搜索引擎,也为它倾注了无数的心血。
问:那么在过去的十七八年里,哪些是你认为做过最棒的工作?
Jeff Dean:首先我为我们的广告系统搭建了最早的框架,并进一步改进维护升级了它。 随后几年我和其他同事把主要的精力放在了核心搜索系统上。这一系统包含了从互联网上爬取数据和页面的抓取系统以及将这些数据整理成可以快速访问的索引系统。
当用户询问Google时,我们必须非常迅速的分析出哪一个页面是与问题最为相关的,并为用户返回一系列结果,就像今天我们访问Google所看到的一样。同时在后台还有一整套服务系统,当用户询问Google时,它需要来决定将问题分发给哪一台计算机来解决,随后将这些独立的分析结果组合起来返还给用户。在这些工作中,我主要负责核心搜索系统和索引系统。
问:介绍一下你目前领导的谷歌大脑计划?
Jeff Dean:我们在其中投入了相当大的研究精力来进行机器学习和人工智能的研究,并利用这一系列研究成果来构建智能系统。这些系统可能会实现产品化,并构建出全新的产品形态。
同时我们也致力于将这些技术嵌入到现有的产品中去。我们经常与Google不同的团队合作开发更加智能化的产品。同时我们也进行一部分纯粹的、没有太清晰产品规划的研究,目的是不断增强和提高我们的系统能力。即使现在我们不知道这些技术和研究的应用,但是未来它们一定会在这里或者那里发光发热。
人工智能 vs. 通用人工智能
问:现在几乎人人都在谈人工智能,但对你而言什么是人工智能?AI对你来说意味着什么?能不能用简单明了的语言告诉我们你认为的人工智能是什么呢?
Jeff Dean:这是一个在计算机发展早期就提出的概念。我认为它本质上是构建一个显示出智能的系统(主体、结构、程序…)。我们人类和其他生物之间的区别在于我们拥有高层次的智慧水平。我们可以彼此交流,吸收知识并且进行高水平的理解和认知。
我们可以通过(基于经验)想象认识到现实世界中某些行为的后果。我们希望能够构建出一个尽可能多的表现出智能特征的系统。但对于狭义的人工智能来说,特指一些能够处理特定任务的智能系统,这就需要十分特定的智能。
但是在我们心底依旧想要构建出一套足够灵活、可以处理不同事物的智能系统。我认为在狭义人工智能的领域我们已经取得了一系列重要的进展,但对于更开放的灵活的智能问题至今仍然面临着巨大的挑战,还需要很多的研究人员投入无数的精力为之奋斗。
问:你一直在强调“举止很智能(behave intelligently)”或者“看起来智能(appear intelligent)”,那么你是否认为人工智能就像人造草皮并不是真正皮革那样,一些系统也并不是真正的智能,而是在模拟智能?
Jeff Dean:我的意思是我认为的人工智能会展现出一系列我们人类认为是智能的特征。虽然生物学和硅基智能有不同的优劣,但是我们真正关心的是:“这一系统是否真正有用,是否能拓展增强人类的智能水平呢?”
问:对于通用人工智能,目前人们对于这一技术出现的估计从5年后到500年后都有,你认为为什么大家的估计会相差如此之大?
Jeff Dean:我认为这主要是由于我们对自己真正的需求还不确定造成的。我们目前对于人类如何处理信息的方式还不甚了解,对于人脑和智能系统的完全没有深入的理解,所以我们真的无从知晓要构架一个相似的系统需要花费多少时间精力。所以一些人认为这即将来临,另一些人认为还有漫长的路要走。而我的观点应该比较中庸。近五到十年来我们获得了巨大的进步,按照这样的进度估计,我认为二三十年后可能出现拥有很多智能特征的系统,但是我对我的期待保留很高的误差。
问:你似乎认为通用人工智能会由现在进行的工作不断演进而成,而相反的观点是那会是完全不同的一个领域,我们现在甚至还没有开始这方面的研究。请问你同意这样的说法吗?
Jeff Dean:我们今天的工作已经触及到了构建通用人工智能系统,我承认还有很多的问题我们没有解决,还有大量的问题我们不了解,但我认为我们今天所从事的研究将会成为未来通用人工智能的一部分。
问:你认为你能见证通用人工智能的到来吗?
Jeff Dean:哈哈,人生充满了意外,但我们想一想不远的十五年或者二十年后,世界上会出现很多很多现在还无法想象、我们所没有的东西,时间将为我们呈现出我们从未见过的未来。
问:你怎么看待机器的意识或者人工智能会产生意识这件事的?
Jeff Dean:我不知道,我平常都会避免卷入这样的哲学争论中去。于我而言,意识就是生物系统的一系列神经元的电脉冲活动,并让其意识到自我和因果等等。从这个角度看,意识并不是什么特殊的东西,它只是智能系统所展现出的多个特征中的一个而已。
问:那么你觉得未来的世界将会怎样呢?我们会不会产生不断解决人共通用智能的机器?那时的世界将会怎样?于人类是好是坏呢?
Jeff Dean:我认为这会是人类社会的一大进步。让我们回想一下从前的一次次变革,在古代我们需要99%的人类来劳作才能获得足够的事物,但在工业革命后很少的一部分人就可以养活绝大多数人群,从而让这些人可以专心从事其他的工作,不断推动社会的进步。我认为人工智能智能将会应用在生活的方方面面,可能不是那么伟大的地方,但是确确实实会从每一个地方改变我们的世界,推动人类社会。
我一直在想如果现在我要处理一个问题,我需要花9-10个小时的时间来思考,查阅论文并总结,随后开始通过其中的信息来帮助我解决问题。那么如果在未来,这一切的工作可以用一句“帮我找到某某领域的文章并总结给我”,可能只需要20秒就能完成,这样的人工智能一定会对我们的工作产生巨大的帮助。
让机器学会学习
问:那么对于目前我们所面临的挑战你有什么看法呢?
Jeff Dean:今天如果我们需要解决一个机器学习的相关问题,我们倾向于让人类机器学习专家介入。我们拥有巨量的数据,庞大的计算能力和机器学习专家来为问题寻找解决的方向。我们的系统可以自己从观察中学习,如何完善这一任务。
这是建立机器学习系统常用的方法,也是视觉和语音在几年来绽放出光彩的原因,也是如今机器翻译越用越准确的原因。
虽然这一系统可以在某一领域做得十分完美,但我们需要的是可以应对多种任务的通用人工智能,可以处理成千上万的事物,甚至是从未遇到过事情。我们希望它可以从自身的经验学习,将上百种事物的经验迅速移植推广到上千种不同的事物上去。
这最后将会称为元学习,在不需要人类机器学习专家的帮助下学会很多的工作。它可以随着时间不断改进自己的能力,并基于已有的经验拓展新的能力。
问:这听起来像是迁移学习?这是一个全新的领域还以一个由来已久的方向呢?
Jeff Dean:人们对于这一问题思考了很长时间了,主要内容是这样的,如果我有一堆任务需要完成,那么我先学会其中的三个任务,随后利用这三个任务的学习结果和更少量的数据来学习第四个任务,一步一步进行下去我们就能得到一个不依靠人类帮助的学习系统了,它可以自己学习处理新的任务。
多任务学习和迁移学习已经在小规模上成功,但我们需要在更大规模上验证它的有效性并实现它。
还有一件事情特别值得注意,就是学会学习(learning to learn)。这意味这一个系统可以依赖于经验自己学习去解决一个全新的任务,甚至为了解决新任务而进行一系列实验。
问:很多人认为人工智能的发展会损害人们的工作机会。如果机器能比人类更快的学习,那么有的人群就会被排除在经济生产之外了。你是如何看待这个问题的呢?
Jeff Dean:我认为在某些行业自动化的确会逐渐取代很多工作岗位,而且这是每个时代都会发生的事情,就像工业革命对农业和手工业造成的冲击一样。
但是人们总能发现新的工作机会,或者总会有新的工作等待着人们去处理。政治家和决策者们应该认真考虑过计算机自动化变革后社会结构的形态和今后的发展,这是一个政策问题。我认为计算机和自动化会取代目前人类从事的重复性,低水平的劳动,但对于复杂的活动计算机还远远没有那个能力去取代人类的工作。
问:你不担心技术带来的失业问题吗?
Jeff Dean:我承认一定会有很多人在这一大潮中失去工作,这很不公平。很多工作将被自动化更好的完成。我想指出的是,最容易被自动化代替的是日复一日的重复劳动,而那些每天都面临不同挑战或者复杂繁多事物的工作是不会那么轻易被取代的。
问:那么现在你在AI方面主要的工作是什么呢?
Jeff Dean:我们团队作为一个整体在做很多方面的工作。我主要为团队指明前进的方向。对于个人来说,我参与研究了一些医疗健康方面的问题,我认为机器学习可以为健康领域带来不一样的改变。
同时我还致力于如何构建出适合于机器学习的计算机软硬件系统,可以为我们提供快速实现验证机器学习想法,并可以大规模应用。我需要和硬件团队一起确定适合机器学习的硬件架构。TensorFlow是我们团队出品的一个开源机器学习框架,在其中涵盖了我们的研究成果,并利用它训练我们自己的产品。同样全球各地的开发者也在利用它创建自己的机器学习系统,并不断完善它的性能。
我现在还在“Learning to learn”的方向上进行研究,因为我认为这将会成为一个十分重要的领域。
问:很多人觉得如果我们构架出了通用人工智能,那将会出现下一个像Google一样的公司?
Jeff Dean:我认为它可能出现在任何地方。我们在这个领域做了相当广阔的努力,这是一个十分重要的领域值得我们不断推进。但通用人工智能是一个十分长期的目标呢。
问:你身体里有几十亿个细胞,但是它们却不知道你是谁,但合起来就是你。你知道你的细胞没有幽默感但是你有。这意味着在一定程度上,一个整体会拥有个体所不具备的特征。当我们开始关注数量时,就像人脑中神经元的连接,我们在数字世界中也见到过同样的量级,这是否会意味着量变带来的质变呢?
Jeff Dean:我认为我们目前还远远没有达到人类大脑的量级,无论是什么样算力的计算机,现在大概和蝾螈差不多吧。但是要建立更加智能的系统,就需要更强的计算能力,那么整个系统的算力也就会越强!
机器学习的发展和未来
问:这几年,随着这两年GPU的崛起,加上不断完善的算法、更丰富的数据库以及更先进的训练集和摩尔定律,人工智能取得了巨大的成功。除了这些因素的综合影响,你觉得还有没有其他标志性的事件发生,带来了这一波人工智能的复兴?
Jeff Dean:在我看来,我们今天使用的很多算法年其实在20年到25年前就已经开发出来了,当时的人们就对尤其是神经网络等机器学习模型抱有很大的兴趣。那为什么到今天它才大放异彩,就是因为当时我们缺乏让它运行起来解决大型问题的计算能力。
所以,如果你从20年前光速移动到08、09年,我们逐渐有了足够强大的计算能力和足够大的有意思的数据集,可以支撑神经网络去解决实际生活中有趣的问题,比如计算机视觉、语音识别等。事实上,神经网络也确实成为了解决这些问题的最佳方式。在过去的十年里,我们也做了大量的研究工作,来增加早年间用新技术开发出来的基础算法。
GPU确实是很重要的一点,但我认为最根本的还是我们认识到了神经网络等机器学习模型与现在在计算机上运行的大多数代码实际上具有不同的计算特性。 这些特点是他们基本上主要做线性代数类型的操作:矩阵乘法向量操作,并且它们对精度降低也有很大的容忍度。所以当你做一个神经网络的计算时,不再需要精确的六位或七位数字,所需要的精度数字要少得多。
这两个因素结合在一起,使得我们可以为非常低精度的线性代数构建专门的硬件,这就增强了我们在这些问题上应用更多计算的能力。除了GPU,我们谷歌也开发了一种新的定制芯片——TPU,它的精度比GPU更低,并具有显著的性能优势。我认为这是一个具有爆发性的领域,因为之前当你在构建专门针对某一子集的特定硬件时,而不是像CPU那样采取非常普遍的计算方式,你就会面临这样的风险,即特定的子集只是你在计算系统中想要做的事情的一小部分。
但是,现今神经网络和机器学习模型适用于非常广泛的领域,比如语音识别、机器翻译、计算机视觉、医药和机器人等。所有这些东西都可以使用相同的基础元素来加速线性代数去实现完全不同的事情。因此,我们可以开发适用于许多不同场景的专用硬件。
问:最后,请你分享一些你近期工作中一些令人振奋的成果好吗?
Jeff Dean:我想我有很多成果想和大家分享,来列举其中代表性的几个:
我认为机器学习在药物和医疗领域的应用是非常重要的。对于医生和其他医护人员来说,这将是一个巨大的帮助,让他们可以快速的获取病人的确切的病理信息,什么对病人是最有效的。还有对医学影像的解读,并基于此提出建设性的意见。
另外,我对机器人的发展也很感兴趣。我认为专门针对机器人的机器学习将在未来五到十年成为一个非常有意思的新兴领域。我认为,这种“学会去学习”的工作将会带来更灵活的系统,在不需要太多机器学习技能的情况下,它们可以学习做新任务。我认为这将是一件非常有趣的事情,因为它会不断进步。
还有就是在所有的机器学习工作之下,为特定的机器学习模型定制个性化的硬件也就会在未来五年成为一个很有意思的方向。
最后的最后,我认为机器学习的领域不仅涉及计算机科学,还能涉及很多人们正在钻研的领域。因此,我觉得目前的发展真的很令人振奋。因为我们意识到了机器学习的光明前景,开始愿意花大力去学习和做机器学习研究,并理解机器学习在不同科学领域或不同应用领域的意义。
这也正是在过去的五到八年时间里,我们特别开心地看到,越来越多来自不同背景的人们都加入了这个领域的研究,在这其中做着自己酷炫的事情。