智能家居设备市场将迎来强劲增长。据IDC预计,到2019年,智能家居设备出货量将同比增长26.9%,达到8.332亿部。到2023年,全球将有近16亿台设备投入使用。
亚马逊对此寄予厚望。Dashbot最近的一项调查显示,75%的受访者每天至少使用一次Alexa等语音助手,其中23%的人说他们用助手控制智能家居设备。在这一群体中,63%的人每天会多次使用家庭自动化助手。
因此,Alexa在控制灯泡、车库门开启器、智能锁和其他智能设备方面变得越来越熟练,或许也就不足为奇了。
为了更好地理解亚马逊在智能家居生态系统中与Alexa相关的工作,我们采访了Nathan Smith,他是为Alexa智能家居客户创建新功能的客户体验团队的负责人。下面是经过编辑的讨论记录。
Nathan Smith认为,智能家居目前正处于大规模应用和扩展的阶段。从传统意义上讲,它包含了更多技术领先的早期应用者,但我们已经超越了这一点。现在有超过60000种产品与7400个不同的制造商的Alexa合作,我们看到的一个趋势是Alexa正在使这些设备的控制越来越民主化。
今年最有意思的是一个新功能,它使用机器学习和人工智能来帮助Alexa,不仅能理解你所说的,而且理解你真正的意思,然后提供一个简单的用户体验。
Smith的团队致力于让Alexa更加人性化。如果你对Alexa下类似“嘿,Alexa,打开沙发灯”之类的指令,但实际上你想打开的灯被称为客厅灯,Alexa不确定你指的是哪个,她会友好地建议“你是说客厅灯吗?”
这项技术使人们在家里可以更随意地说话,并且超越了Alexa之前理解的严格的语法,它在许多不同的实际用例中都有帮助。一种是有类似发音的单词,另一种是混合字符,比如人们在自己的或在Alexa智能手机应用程序的设备名称中添加表情符号。它可以在不严格要求准确发音的情况下解析单词,甚至可以在多语言情况下提供帮助。如果你使用不同语言的混合名称,Alexa可以从中学习。
Smith的团队试图建立一个让Alexa可以更自然地理解你的世界,而不是训练人们用Alexa的语言说话。如果Alexa非常清楚你在说什么,就可以简单地执行预期的任务。
Alexa从去年12月底开始在美国推出这一功能,最近又将其扩展到加拿大、澳大利亚、英国和印度。就早期结果而言,当Alexa向客户提出建议时,在平均80-90%的时间里客户都会接受建议。
Alexa在决定如何响应一个命令时,还考虑了哪些其他因素?
收集实际实况,并将它们吸收到语义和行为模型中,这些模型以一种非常人性化的方式向你学习——就像一个孩子问有关世界的问题的方式——支撑着Alexa的机器学习。我们的模型真正做的是根据设备状态和行为信号(比如哪些设备通常在什么时候打开)以及日期和时间等环境信号对信号进行分层。在生成建议时,模型会考虑上述所有因素。
我们还有很多工作要做。我们看到越来越多来自各行各业和不同技术背景的客户使用支持Alexa的智能家居设备,这是采用尖端技术并利用它帮助简化客户体验的第一步。
你和你的团队正在用人工智能解决的其他挑战是什么?
人工智能和机器学习是Alexa的核心,从语言处理和理解,到智能地将命令路由到正确的功能。
功能方面,我们有Hunches,Alexa通过它从连接的传感器或设备中获取信息。当你说“Alexa,晚安”之类的命令时,它会检查你的车库灯是否还亮着,以及它们是否在一天中的那个时候通常是关着的,这就会通知响应。Alexa会说类似这样的话“晚安。顺便说一句,我注意到你车库的灯开着。要不要我帮你把它们关掉?”并在智能家居常规的某些阶段给客户提供有用的反馈,而不需要他们去钻研一堆应用程序屏幕。
这些功能使用AWS支持的机器学习技术。我们在SageMaker平台上大规模运行这些实时功能,这使我们能够更快地迭代。
你还有哪些方法可以让首次购买者在使用时更简单?
我们已经在这方面努力了很长一段时间了,最让我们兴奋的事情之一就是这种零触控设置的能力。去年,我们发布了Wi-Fi简易设置,它可以让你快速配置亚马逊的Wi-Fi设备,比如亚马逊Smart Plug。基本上,只要你插上电源,Alexa就会说:“嘿,我找到你的新设备了。”不需要其他设置。我们将同样的体验带到蓝牙低能耗灯泡上,比如飞利浦新推出的Hue产品,我们正在努力扩大这项技术的广泛应用。
至于如何进行设置之后的配置,去年年底,我们发布了几个功能,可以帮助你做一些其他的设置,通过语音获取环境信息,你可能需要与Alexa进行完全自然的交互。我们希望客户能够把他们的设备放在房间里,这样当他们在一组设备中提到一个设备时,Alexa就能做出正确响应。
这就是为什么我们在去年推出了一种对环境更加敏感的设置体验。如果你说“Alexa,把灯打开”,她就会用声音引导你,然后把灯打开。我们已经看到客户真正接受了这一点,因为它不会妨碍设备的控制。
你是否必须考虑不同的Alexa设备形式因素?例如Echo Dot和Echo Show。
我们认为它是不同模式(应用程序、语音和屏幕)之间的一个网格,因为每种模式都有不同的优势。当你想做一些不用手就能完成的事情时,语音很方便,但当你想安静地做一些事情时,语音就不太合适了。这就是我们依赖于基于屏幕的交互的地方。
我们真正感到兴奋的是确保,随着越来越多的不同客户开始使用Alexa,我们能够跟上他们的需求,而不是向后看,然后说:“好吧,我们如何向这些客户传授过去的模式?”相反,我们使用机器学习等技术来展望未来,并从中学习。
关键是使用的这项技术要适合问题的类型,无论是检查行为模式或试图用实况建立语义库,然后调优一个元模型,将那些个人信号考虑其中,产生一个有用的用户体验,而不是仅仅是做假设。