Facebook研发语音识别：让电脑像人类一样说话

为了让电脑更好地理解人类的语言，Facebook周一成立了一个研究项目，希望开发更加强大的语音识别软件。苹果Siri、亚马逊Alexa和谷歌Assistant都使用了这样的技术。值得一提的是，该公司甚至还在寻求外部人士的帮助。

Facebook的目标是让电脑最终能够与人类展开有意义的对话。如果能成功，就将较现有的初级技术向前迈进一大步。

人们现在可以通过语音让亚马逊Echo音箱播放歌曲或拨打电话。但这些技术还无法理解或响应更加复杂的对话内容，例如与人争论哪一张才是披头士乐队最好的专辑，或者针对有线电视费用展开分析。

“如果没有剧本，就表演不好。”Facebook人工智能研究总监Yann LeCun说。深度学习等人工智能的进步已经可以教会电脑识别图片中的猫，但理解语言却是一项更为复杂的任务。

例如，LeCun表示，电脑往往会把下面两个句子搞混：“奖杯放不进手提箱，因为它太大了。”以及“奖杯放不进手提箱，因为它太小了。”

要理解这两个句子，需要分析“它”所指的具体对象。根据“大”和“小”两个线索，可以判断“它”究竟指的是“奖杯”还是“手提箱”。人类通常可以明白：第一句话是说奖杯太大，放不进行李箱；第二句话是说手提箱太小，奖杯放不进去。

但电脑缺乏对物体尺寸的基本了解，因会搞错两个句子的意思。要充分理解语言，电脑就必须知道物理世界的一些基本事实，避免搞混简单的句子。

要为电脑提供帮助，方法之一就是为其提供各种对话和网络语言实例，将此作为教学工具。例如，研究人员曾经使用Reddit的上关于电影的讨论数据来训练电脑，使之学会人类讨论自己喜欢的电影时使用的聊天方式。在另外一个案例中，研究人员还使用维基百科的数据来训练电脑回答与具体电影有关的问题。

Facebook希望让世界各地的研究人员可以分享他们通过具体的实验得出的结论，并共享他们使用的数据。该公司相信，这种合作可以加快这项技术的发展，并最终让电脑完全理解人类语言。

Facebook的人工智能研究团队开发了免费的软件工具，供其他人免费下载，并为他们的实验提供帮助，使之可以汇总数据，并查看其他项目参与者的研究成果。这些软件都开放了源代码，所以其他人也可以贡献自己的研究成果，从而改进底层技术。

目前还不清楚其他大公司的人工智能研究人员是否会加入Facebook的项目，并为这项技术做出贡献。但Facebook高管表示，微软等公司的研究人员已经表达了兴趣。

Facebook认为，尽管很多从事语音软件开发的公司彼此之间存在竞争，但也可以通过相互合作获益。但由于这类研究所对应的产品可能关系到价值数十亿美元的产品，加之Facebook、谷歌、苹果、亚马逊和微软都存在激烈的竞争关系，因此他们之间的合作希望似乎比较渺茫。

不过，LeCun表示，该项目的最终目标是创造能够完全理解对话的强大电脑，这还要等待多年才有可能实现。他表示，短期目标是让数字助手能够根据用户自主提供的兴趣数据推荐有用的信息和新闻。

LeCun说，这种数字朋友将成为“个性化的虚拟助手，让人不会对他们产生厌烦。”因为他们多数情况下都会理解你的意思，而不会茫然无措。但要真正开发他梦想中的“通用智能”仍然有很长距离，这种智能就像电影《Her》里面描述的一样，你甚至有可能与她坠入爱河。