亚马逊今天在re:MARS大会上首次展示了Alexa Conversations预览版,基于新的深度学习模型,其语音助手Alexa如今可以通过更自然的多任务对话自然衔接,使Alexa技能与其他技能互连,完成“联动操作”。
(截图自亚马逊Alexa官网)
Alexa副总裁兼首席科学家Rohit Prasad在会议上表示,对话缩减了创建语音应用程序所需的代码行,从5,500行缩短至1,700行代码(减少大约三分之一)。除了代码行,相应的培训数据也变少了。
开发人员创建Alexa Skills,可通过单个对话生成对客户问题和请求的响应,最后完成多项任务。也就是说,依靠一个新的对话系统,就可以预测下一步行动,并轻松地在不同的Alexa技能之间切换。“现在,我们已经提升了我们的机器学习能力,以便Alexa可以从对话的方向预测客户的真正目标,并主动实现跨技能的对话流程,”亚马逊解释说。
这减少了一系列交互,这些交互可能使得与Alexa技能的40次个人交换减少到大约12次。开发人员给出API访问和API可访问的实体列表等内容——如电影或餐馆名称,然后Conversations就可以接下去处理其余的事情,非常“高能高效”。
与Alexa的多转互动已经有一段时间了,但Alexa Conversations旨在帮助人们通过AI助手的超过90,000 Alexa技能快速完成更多工作。该体验旨在帮助人们下订单购买,因此如果您订购电影票,后续可能会通过让您与OpenTable互动,以便进行晚餐预订或Uber打车。Uber和OpenTable都是Alexa Conversations的早期采用者,卖电影票的Atom Tickets也是重要的合作品牌。
(截图自亚马逊Alexa官网)
这种方法与其他对话系统的不同之处在于,它对整个系统进行端到端建模,系统将语音文本作为输入,并将动作作为输出。Alexa将从对话的方向预测客户的潜在目标,并主动实现跨主题和技能的对话流程。“这是会话AI的一次重大飞跃。我们的目标是将认知负担从客户转移到Alexa。”Prasad说道。
Alexa Conversations建立在亚马逊的工作基础上,将文字应用与语音应用相匹配,它融合了诸如能够为智能家居设备(如Roomba机器人)开始清洁地板的“Alexa,开始清洁”等功能。它还借鉴了最近几个月推出的主动功能,例如Hunches和Alexa Guard的家庭安全功能。
Alexa Presentation Language于去年秋季在公共测试版中推出,旨在帮助Alexa技能开发人员提供更多视觉体验。Alexa Conversations将使用AI来更好地理解用户意图,这样制作语音应用程序的开发人员就不需要去力求涵盖一个人提出问题的所有意图或方式,以进行相应的复杂应对。
这种方法看起来类似于微软用Cortana和Semantic Machines开发的类型,以及Google Assistant希望通过Continued Conversations实现的方法。
它带来了不需要像“Alexa”或“嘿,谷歌”这样的唤醒词就可以导致更自然的互动和直观地完成更多工作的能力,就像你可以用人类助手完成任务一样。随着时间的推移,它还将学习现实世界用户如何与系统交互。
关键词: 亚马逊 Alexa Conversations