近日,Facebook 的 AI 实验室开发出了一款名叫 Ink 的动画聊天机器人,这款机器人通过人工智能算法控制动画实现了在与人交谈的过程中对人的面部表情做出反应,做出的反应很自然,以至于让人觉得它和人类几乎没有什么差别。
68 个关键点的准确识别
机器人的研发过程中多数会遇到「恐怖谷效应」,人形机器人的相似度与人类的好感度不成正比,随着物体拟人程度增加,人类的反应呈增-减-增曲线,当拟人度达到某一程度时,人类好感度会大幅下降,甚至还会觉得拟人物惊悚可怕。而 Facebook 研发的可以表达情绪的机器人让我们距离攻克这个障碍又近了一步。
在我们与他人交谈的过程中,数以百万计的微小肌肉的运动改变了我们眼睛,嘴巴以及头部的位置,而这些位置的改变向正在与我们交流的对象发出了我们正在作何思考的信号。AI 实验室根据这个特性利用人工智能对聊天机器人进行数百个 Skype 视频对话训练,让它学习然后模拟人类是如何转换他们的表情来回应其他人的。
为了更好的明确人类是如何转换他们的表情来回应其他人的,在 Skype 视频对话期间,研究人员将视频画面中的人脸选出 68 个关键点,然后在每组对话中全程跟踪对话者脸上的这 68 个关键点。在学习一段时间后,动画机器人可以实时预测可能出现的面部表情。如果对视频中人所说的东西表示认同,机器人就会点下头;如果视频中人在笑,机器人也可能开嘴笑。
自然且真实的反应
在这款机器人大量学习之后,Facebook 的团队让志愿者们观看动画视频来测试系统,这些动画视频包括人和人对话的原版视频,以及训练后的机器人模拟的反应,而志愿者最终给出的结果是这款机器人有着和人类近乎一致的反应,反应自然且真实。
测试结果显示在交谈过程中,聊天动画机器人与人类在嘴部和眼部有着几近相同的张合度,机器人对表情的预测也与正常人类的表情基本一致。
目前 Facebook 的这款聊天机器人做出的反应还只能是以动画的形式展现,现在的算法还不支持将这种做出的反应直接应用到更加逼真的类人的机器人身上。
未来仍有新高度
在这个案例中,Facebook 开发的聊天机器人只是创造了一种普通的「人格」,一位来自以色列的 AI 研究员表示。此外他还称,对 AI 来说,真正理解面部交流而不仅仅是模仿是很重要的,真实的面部表情是基于人类当时的想法和感受而展现的,目前这种通过学习来展现基本表情的方式还不足以创造出真实的对话模式。
相比于动画机器人,人类更加喜欢与能够模仿人类自身面部表情的机器人交流,但目前机器人不是很擅长掌握人类表情的微妙变化。即使如此,Facebook 的这款聊天动画机器人也将聊天机器人的领域提升到了一个新高度。而在未来,更加先进的机器人则可创造出真实的对话模式,其性格可能更复杂,或能根据谈话对象调整自己的性格。