这对谷歌来说并不容易。苹果早就推出了iPhone手机,作为Siri语音助手的载体;亚马逊也为Alexa量身打造了Echo和Dot音箱。它们在消费市场建立起了巨大的优势。而谷歌直到去年才推出相应的智能硬件设备,从起跑线上就已经落后了一大截。
语音正逐渐成为用户与人工智能交互的重要形式之一。人工智能不仅意味着人类获取信息的方式将迎来重大变革,也预示着计算能力的跳跃式发展。因此,在这场即将到来的人工智能生态战争中,谷歌绝对不能错失良机。
要掌握语音技术,谷歌必须克服两大难题:一、语音技术对谷歌的主营业务——广告,并不友好;二、语音不像显示屏可以用列表的形式展示搜索结果。
尽管谷歌设备上的语音技术涉及许多其他功能,人们还是习惯称之为“语音搜索”。2010年,谷歌首次将语音功能引入了安卓系统,并称之为“Voice Actions”。而稍后推出的,在Google Home、Pixel手机和新版安卓上运行的Assistant语音助手则代表了谷歌语音技术的最高水准。
据了解,Assistant除了能显示网络搜索结果,还可以连接其他智能设备,以便用户通过语音来控制它们。用户还可以通过Assistant获取个人信息,比如Google Calendar中的行程安排。
虽然大多数消费者对Assistant的认知仅限于从Google Home中发出的声音,但其实它也可以在文本环境下工作。
迄今为止,谷歌对如何通过Assistant和语音搜索服务盈利,尚没有明确计划。谷歌首席执行官Sundar Pichai在1月份的第四季度财报电话会议中强调说,语音技术目前尚处在初级阶段,谷歌当下的工作重心是确保谷歌的语音工具对消费者来说随时可用。
在Web时代,谷歌可以通过在搜索结果中投放广告,向企业和广告主收费,以此盈利。但谷歌并不打算在语音搜索中重复这一模式。我们现在从Google Home中听到的内容,都不是企业付费的结果。
除了广告,谷歌也可以学习亚马逊Echo的商业模式,通过电子商务赚钱。不过鉴于谷歌在产品搜索和线上购物方面全面落后于亚马逊,谷歌想要后来居上,把在线购物变成其语音服务的主要收入来源,似乎不太现实。
虽然谷歌表示不会在语音服务中植入广告,今年3月份,Google Home却播放了一段很像广告的内容。当时用户正向Google Home询问当天的日程安排,“Okay Google, tell me about my day(谷歌,告诉我今天的安排)”;不料Google Home播放完日程表继续说道:“by the way, Disney’s live action ‘Beauty and the Beast’ opens today(顺便说一下,迪士尼的电影《美女与野兽》今天上映)”。
用户对此猝不及防,并在社交媒体上抱怨道,不管这些内容是什么,它们都不是我预期听到的,而且(广告)也未免太直接了。
谷歌则解释说,这不是一次商业行为,不过这条内容确实展示了如何在语音中植入广告。
当初谷歌在网页搜索结果中显示付费推广信息时,就曾引起了用户的不满。不过在网页时代,用户可以选择不点击这些链接,而进入语音时代,跳过和忽视语音中广告信息变得愈加困难。因此,谷歌面临的最大问题在于,用户恐怕更加难以容忍语音中的广告信息。
谷歌要想在语音市场占有一席之地,就必然要尽可能多地销售运作为AI软件载体的Google Home和Pixel手机。
但是谷歌直到2016年底才发力智能硬件领域,发布Google Home音箱和Pixel手机。彼时,苹果公司已经售出了大约10亿部iPhone。据研究公司Strategy Analytics估算,亚马逊也已经累计售出了630万台Echo和Dot音箱。
根据Strategy Analytics的预测,到今年年中,谷歌的家庭音箱设备将突破百万销量大关。另外,据摩根士丹利(Morgan Stanley)统计,谷歌有望在第四季度售出300-500万部Pixel手机。
虽然谷歌表示,其AI助手可以在更多设备上使用,尤其是在新版安卓系统近期迎来更新后,已经有2亿设备可以使用谷歌的AI助手了。但这只说明了可能性,不意味着一定会发生。事实上,谷歌缺乏对制造商和移动网络的掌控力,无法确保这些设备获得支持AI语音助手的必备更新。相比之下,虽然不少人很讨厌Siri,但更多人却正在使用这款语音助手,因为他们手中握着iPhone,而且苹果对Siri拥有完全的控制力。
当用户向Assistant语音助手发起语音搜索请求时,它无法像在网页上那样把所有可能的结果一次性展现出来。相反,它需要把搜索到的结果读出来,就像谷歌已经认可了这些答案似的,效果相当于用户点击了网页上的链接。
一旦谷歌反馈的结果出现错误,这一缺点将无限放大。据雷锋网了解,今年三月份就曾发生过这种情况:用户发现,当你问Google Home“奥巴马是否在策划政变”时,Google Home会读取网页上的错误内容,回答说“前总统奥巴马正试图推翻政府”。
谷歌最近推出了一项新技术,这项技术使得Google Home能够在多个用户间切换。众所周知,Assistant语音助手可以搜集用户的个人数据,比如搜索记录和日程表。谷歌推出这项新技术的初衷就是,允许用户在Google Home中检索个人信息,同时确保这些信息不会被其他用户获取。
这项技术本身是不错的,但万一AI出错了呢?这就会造成隐私泄露问题,在“问题家庭”中尤为严重。
电子前沿基金会首席计算机科学家彼得·埃克斯利(Peter Eckersley)表示:“当父母和子女之间存在虐待或强权关系时问题最糟糕,在这两种情况下,隐私将遭受严峻的挑战。”
谷歌也承认Google Home的语音识别技术并不完美,并声明说:“我们正在不断努力完善语音识别系统,未来它将变得更好。”
其实这并非Assistant第一次遭遇多用户情况下的隐私问题。谷歌的文字聊天软件Allo曾经在未经用户许可的情况下,把用户的地图信息分享出去,而且还有可能把用户的搜索记录分享出。目前,谷歌已经修复了这一漏洞。
如果谷歌无法妥善地解决隐私问题,用户很可能会不再使用这项功能,甚至不再使用所有基于谷歌语音的技术。
人们现在越来越习惯于通过语音和计算机交互,但是相比传统的键盘输入,语音输入仍存在着诸多缺陷:
用户通过键盘输入时,一旦出错,调整起来相对容易,语音则复杂得多。加州大学伯克利分校计算机科学教授丹·克莱因(Dan Klein)表示:“当你输入一个搜索指令,如果它不起作用,你可以对搜索指令进行修改;但这一优良“基因”并没有继承到语音搜索中来。
另外,语音工具还面临着口音的挑战。谷歌发言人说道:“对于计算机来说,识别不同的口音和说话方式是很困难的,这正是我们不断用语音数据训练服务系统的原因”。该发言人还表示,谷歌目前仍在不断训练其语音识别系统,以更好地识别口音。
语音助手不仅在识别用户指令上存在障碍,在向用户反馈结果时同样存在很大的局限性。语音形式的反馈必须比文字更加简短,至少在Assistant的架构下是这样子的。“它不会暗示你还有其他可能的结果”,SEO营销人员Will Critchlow说道。