随着亚马逊的智能音箱Echo销量逼近千万,Alexa无疑成为了全球范围内截至目前最为成功的消费级AI产品,也可谓是亚马逊在人工智能领域的一次跨界奇迹,极大地刺激了国内各个科技公司也纷纷进入语音交互领域。根据内部人士提供的数据,包括阿里巴巴、百度、腾讯、华为、小米、联想、海尔、科大讯飞等超过200多家国内公司正在研发类似Echo的智能音箱。
但我们真的认真琢磨过亚马逊的Alexa吗?或者我们真的了解评测过Echo吗?尽管亚马逊在这个领域持续投入了多年,但是亚马逊一向对于PR的宣传审核严格,实际上国内对于其技术细节方面的思考知之甚少。
最近,在EmTech Digital人工智能峰会上,MIT Technology总编辑Jason Pontin对话亚马逊Alexa负责人Toni Reid,透露了一些他关于消费级语音交互系统的思考。Toni Reid经历了Alexa从无到有的全过程,他解释了Alexa为什么不用屏幕以及多轮对话的原因。
Toni Reid认为,语音是最简单、最自然的交互方式,也是人类沟通最基本的方式。所以,亚马逊在为Alexa设计硬件载体Echo的时候,并没有为其加上屏幕。这种做法其实是增加了难度:用户只能通过纯语音来使用设备,而并没有屏幕反馈作为辅助。当然,亚马逊也正在Fire TV和Kindle平板电脑等设备上尝试部署Alexa,但这涉及Alexa比较大的改变。
Toni Reid坚持认为,当用户下达语音指令后,Alexa实际上只有一次机会去部署相应的动作,而不能和用户进行多轮对话。一般而言只有两次对话机会,如果第三次对话还没弄清用户需求,就算彻底失败。这样的对话对用户来说是很糟糕的体验。
这是两个非常值得国内用户思考的问题。
那么,为什么亚马逊能在AI领域脱颖而出?
实际上,如果不是Echo惊人的销量,亚马逊甚至都没有被归为人工智能公司。因为相比Google、Microsoft、Apple、Facebook,甚至包括百度、阿里巴巴、腾讯,亚马逊实在拿不出像样的产品,甚至更难堪一点的是,Echo一开始的项目优先级也是最低的。
但亚马逊的成功有偶然,也有必然。从科学实验的角度来看,偶然性确实很大,成功的实验往往都是那么偶尔的一个闪光,但是这个闪光却也是亚马逊长期投入的必然结果。
首先,亚马逊的优势在于没有太大的技术包袱,正因为没有过多的历史限制,才会让产品和技术结合得更加紧密,而不至于让产品思维被工程师所束缚。特别重要的是亚马逊Echo切中的市场痛点是远场语音交互,这让Google、Microsoft、Apple长期积累的近场语音交互优势几乎没有意义。
其次,亚马逊对技术细节的耐心超越了Google、Microsoft这些AI巨头。亚马逊和Apple对于技术PR和论文都没有多大兴趣,但是对于产品和专利却极其上心。从公司角度来看,PR和论文确实耗费公司极大的精力,这两者对于创业公司来说可能是提高知名度的重要方法,但是对于成熟公司,知识产权、产品和营销能力显然更加重要,而且这也决定了公司对于技术的耐心程度。因为过多的PR和论文会让研究人员忽略对于技术细节的把控。
最后,技术人员往往容易陷入科学幻想,喜欢做很多超前的事情。这在技术领域是必要的,但不要让工程师甚至科学家过多干涉产品定义也是非常重要的一个方面。市场上永远都是满足当前需求的产品才能获得用户,而不是你的技术多么高,显然亚马逊更是轻装上阵,灵活的产品思考是Echo定义的关键因素,这样才能更容易懂得用户。