谁更具市场潜力
按照距离麦克风的远近,以上三种语音交互的场景,可分为两类:一是远场语音(在车载、智能家居环境下,离麦克风3-5米),二是近场语音(嘴巴贴近麦克风,与产品对话)。
Amazon Echo系列产品在2016年卖出了超过650万台,可谓远场语音的典范。亚马逊将语音交互落地到智能家居上,加入麦克风阵列,对不同方向的声音信号进行处理,解决了部分远场化的问题,但是由于定向拾音的角度有限,说话人的移动成为问题。亚马逊Alexa负责人 Toni Reid认为,“当用户下达语音指令后,Alexa实际上只有一次机会去部署相应的动作,而不能去和用户进行多轮对话,反复对话对用户来说是很糟糕的体验。”
2011年iPhone 4s发布Siri语音助手,是苹果在语音交互棋盘上下的第一颗棋子,之后Siri不断迭代,但在远场语音方面,Siri比不上ALexa。因此,苹果选择以近场语音交互为主的airPod为切入点发力,这一举措巩固了苹果在近场语音中的王者地位。数据显示,airpods上线短短一个月,就异军突起占据了美国无线耳机26%的市场份额。
相比音箱,智能耳机的利用率更高。智能家居、车载语音产品,要依托一个固定的环境,从这一点来看,以智能耳机为代表的近场语音产品更个人化。远场语音下,用户总是要保证声源距离,才能完成语音交互,若声源距离较远,音量不够大,那语音识别率将会大受影响。戴在耳朵上的智能耳机,离人的语言器官嘴巴近,当你和智能耳机进行语音交互的时候,更像是和朋友交谈。这就如同大声嘶喊和两个人窃窃私语。
智能耳机的携带方便,决定了它有更多自然的使用场景。以电脑和智能手机为例,当电脑发展成为基础设施走入千家万户,几乎人手一台,用户长时间大规模的使用;后来,几乎兼容电脑的智能手机,扩充了传统手机的使用范围,并且体积轻小携带方便,用户量迅速扩展,人们自然而然的从PC时代迈入智能手机时代。
MSR首席研究员、语音专家俞栋指出,“目前一般远场识别的错误率是近场识别错误率的两倍左右”,当产品真正落地的时候,近场语音带来了更好的用户体验。
去年,“互联网女皇”的玛丽·米克尔发布的2016年互联网趋势报告中,谈及“语音正在被重塑,成为人机交互的新方式,在过去75年里,每10年就有一次人机交互的重大革新,人类对机器的操作,从物理手柄按键,到物理键盘鼠标,再到触摸屏,现在语音成为了重要的交互方式。”在这场语音交互入口争夺战中,以智能耳机为代表的“on the go”场景语音产品,因为更接近语言交流的器官,应用场景更广泛,或将成为语音交互的最大入口。