Salesforce的一个研究团队想出了一个聪明的办法来提高许多现代语言程序的性能,即在训练算法完成其他任务之前,教其说另一种语言。
教会机器保持连贯的对话仍然是人工智能领域的一大突出挑战,因为要想清楚地理解口语或文字的含义,往往需要对世界有更广泛的理解或者常识。
事实证明,训练机器学习系统在两种语言之间进行转换,可以自动地教会它有关搭配关系和恰当语境的内容。当这个系统被用作另一个训练来进行对话,或者检测文字中包含的情绪的机器学习系统的基础时,它的表现远远好于一个从头开始训练的系统。
Salesforce的首席科学家、应用机器学习与语言的专家理查德·苏格说,“我们正在使用机器翻译数据,我们基本上是在教授模型如何理解词汇和语境。”
这项工作是机器学习的进步提高人工智能系统语言技能的一个例子。许多基于深度学习的计算机视觉系统利用了某种形式的网络预训练,而据苏格所言,机器翻译可能提供了一种类似的方式来引导自然语言系统。
Salesforce是一个在销售,营销和商业之间管理客户互动的在线平台,已经通过其爱因斯坦平台提供了一系列人工智能工具。其中一种是自动分类电子邮件或聊天消息的情绪的工具,另一种是工作人员根据他或她以前的活动追求的潜在客户的优先级。
他相信这一发现将有助于提高爱因斯坦平台的自然语言能力。他说,“对于聊天机器人和自动化客户支持来说,这是非常有用的。”
Salesforce的研究人员训练出了一个可以在英语和德语之间进行翻译的深度学习系统。这涉及到将大量的翻译文档输入到一个多层的神经网络中,并不断调整网络参数,直到它学会自动生成一个像样的翻译。这个系统用矢量表示单词,这是一种编码和解析文本意义的常用方法。
然后,研究人员对双语网络进行了培训,让他们做各种各样的事情:确定一段文本的情绪;对不同类型的问题进行分类;然后回答问题。他们还发现,他们的预训练网络超过了没有学过第二语言的人的表现。
机器翻译数据集特别大,这有助于机器学习这一挑战。参与该项目的Salesforce研究人员麦凯恩说,“翻译和其他语言之间有着重要的联系。翻译数据集是非常普遍的,它们包含的信息对自然语言处理来说是非常有用的。”