谷歌语音助手走进家庭：可不止是听声识人这么简单

在当今的科技圈，语音技术无疑是最热门的概念之一。硅谷的几大科技巨头都在努力争夺这片新领地的主导权。作为科技圈的老大哥，谷歌有望凭借在搜索和语言分析方面的深厚技术沉淀，从这场争夺战中脱颖而出。但如果谷歌想把控制权牢牢攥在手中，就必须确保用户在不接触手机和屏幕设备的情况下，仍在使用它的服务。为此，谷歌必须在语音技术领域寻找更大的立足点。

这对谷歌来说并不容易。苹果早就推出了iPhone手机，作为Siri语音助手的载体；亚马逊也为Alexa量身打造了Echo和Dot音箱。它们在消费市场建立起了巨大的优势。而谷歌直到去年才推出相应的智能硬件设备，从起跑线上就已经落后了一大截。

语音正逐渐成为用户与人工智能交互的重要形式之一。人工智能不仅意味着人类获取信息的方式将迎来重大变革，也预示着计算能力的跳跃式发展。因此，在这场即将到来的人工智能生态战争中，谷歌绝对不能错失良机。

要掌握语音技术，谷歌必须克服两大难题：一、语音技术对谷歌的主营业务——广告，并不友好；二、语音不像显示屏可以用列表的形式展示搜索结果。

尽管谷歌设备上的语音技术涉及许多其他功能，人们还是习惯称之为“语音搜索”。2010年，谷歌首次将语音功能引入了安卓系统，并称之为“Voice Actions”。而稍后推出的，在Google Home、Pixel手机和新版安卓上运行的Assistant语音助手则代表了谷歌语音技术的最高水准。

据了解，Assistant除了能显示网络搜索结果，还可以连接其他智能设备，以便用户通过语音来控制它们。用户还可以通过Assistant获取个人信息，比如Google Calendar中的行程安排。

虽然大多数消费者对Assistant的认知仅限于从Google Home中发出的声音，但其实它也可以在文本环境下工作。

迄今为止，谷歌对如何通过Assistant和语音搜索服务盈利，尚没有明确计划。谷歌首席执行官Sundar Pichai在1月份的第四季度财报电话会议中强调说，语音技术目前尚处在初级阶段，谷歌当下的工作重心是确保谷歌的语音工具对消费者来说随时可用。

在Web时代，谷歌可以通过在搜索结果中投放广告，向企业和广告主收费，以此盈利。但谷歌并不打算在语音搜索中重复这一模式。我们现在从Google Home中听到的内容，都不是企业付费的结果。

除了广告，谷歌也可以学习亚马逊Echo的商业模式，通过电子商务赚钱。不过鉴于谷歌在产品搜索和线上购物方面全面落后于亚马逊，谷歌想要后来居上，把在线购物变成其语音服务的主要收入来源，似乎不太现实。

虽然谷歌表示不会在语音服务中植入广告，今年3月份，Google Home却播放了一段很像广告的内容。当时用户正向Google Home询问当天的日程安排，“Okay Google, tell me about my day（谷歌，告诉我今天的安排）”；不料Google Home播放完日程表继续说道：“by the way, Disney’s live action ‘Beauty and the Beast’ opens today（顺便说一下，迪士尼的电影《美女与野兽》今天上映）”。

用户对此猝不及防，并在社交媒体上抱怨道，不管这些内容是什么，它们都不是我预期听到的，而且（广告）也未免太直接了。

谷歌则解释说，这不是一次商业行为，不过这条内容确实展示了如何在语音中植入广告。

当初谷歌在网页搜索结果中显示付费推广信息时，就曾引起了用户的不满。不过在网页时代，用户可以选择不点击这些链接，而进入语音时代，跳过和忽视语音中广告信息变得愈加困难。因此，谷歌面临的最大问题在于，用户恐怕更加难以容忍语音中的广告信息。

谷歌要想在语音市场占有一席之地，就必然要尽可能多地销售运作为AI软件载体的Google Home和Pixel手机。

但是谷歌直到2016年底才发力智能硬件领域，发布Google Home音箱和Pixel手机。彼时，苹果公司已经售出了大约10亿部iPhone。据研究公司Strategy Analytics估算，亚马逊也已经累计售出了630万台Echo和Dot音箱。

根据Strategy Analytics的预测，到今年年中，谷歌的家庭音箱设备将突破百万销量大关。另外，据摩根士丹利（Morgan Stanley）统计，谷歌有望在第四季度售出300-500万部Pixel手机。

虽然谷歌表示，其AI助手可以在更多设备上使用，尤其是在新版安卓系统近期迎来更新后，已经有2亿设备可以使用谷歌的AI助手了。但这只说明了可能性，不意味着一定会发生。事实上，谷歌缺乏对制造商和移动网络的掌控力，无法确保这些设备获得支持AI语音助手的必备更新。相比之下，虽然不少人很讨厌Siri，但更多人却正在使用这款语音助手，因为他们手中握着iPhone，而且苹果对Siri拥有完全的控制力。

当用户向Assistant语音助手发起语音搜索请求时，它无法像在网页上那样把所有可能的结果一次性展现出来。相反，它需要把搜索到的结果读出来，就像谷歌已经认可了这些答案似的，效果相当于用户点击了网页上的链接。

一旦谷歌反馈的结果出现错误，这一缺点将无限放大。据雷锋网了解，今年三月份就曾发生过这种情况：用户发现，当你问Google Home“奥巴马是否在策划政变”时，Google Home会读取网页上的错误内容，回答说“前总统奥巴马正试图推翻政府”。

谷歌最近推出了一项新技术，这项技术使得Google Home能够在多个用户间切换。众所周知，Assistant语音助手可以搜集用户的个人数据，比如搜索记录和日程表。谷歌推出这项新技术的初衷就是，允许用户在Google Home中检索个人信息，同时确保这些信息不会被其他用户获取。

这项技术本身是不错的，但万一AI出错了呢？这就会造成隐私泄露问题，在“问题家庭”中尤为严重。

电子前沿基金会首席计算机科学家彼得·埃克斯利（Peter Eckersley）表示：“当父母和子女之间存在虐待或强权关系时问题最糟糕，在这两种情况下，隐私将遭受严峻的挑战。”

谷歌也承认Google Home的语音识别技术并不完美，并声明说：“我们正在不断努力完善语音识别系统，未来它将变得更好。”

其实这并非Assistant第一次遭遇多用户情况下的隐私问题。谷歌的文字聊天软件Allo曾经在未经用户许可的情况下，把用户的地图信息分享出去，而且还有可能把用户的搜索记录分享出。目前，谷歌已经修复了这一漏洞。

如果谷歌无法妥善地解决隐私问题，用户很可能会不再使用这项功能，甚至不再使用所有基于谷歌语音的技术。

人们现在越来越习惯于通过语音和计算机交互，但是相比传统的键盘输入，语音输入仍存在着诸多缺陷：

用户通过键盘输入时，一旦出错，调整起来相对容易，语音则复杂得多。加州大学伯克利分校计算机科学教授丹·克莱因（Dan Klein）表示：“当你输入一个搜索指令，如果它不起作用，你可以对搜索指令进行修改；但这一优良“基因”并没有继承到语音搜索中来。

另外，语音工具还面临着口音的挑战。谷歌发言人说道：“对于计算机来说，识别不同的口音和说话方式是很困难的，这正是我们不断用语音数据训练服务系统的原因”。该发言人还表示，谷歌目前仍在不断训练其语音识别系统，以更好地识别口音。

语音助手不仅在识别用户指令上存在障碍，在向用户反馈结果时同样存在很大的局限性。语音形式的反馈必须比文字更加简短，至少在Assistant的架构下是这样子的。“它不会暗示你还有其他可能的结果”，SEO营销人员Will Critchlow说道。

谷歌语音助手走进家庭：可不止是听声识人这么简单

相关推荐

今日推荐

最新文章

热门文章