亚马逊、谷歌齐发力 语音交互时代来临?

OFweek 智能家居网 Eric 中字

从谷歌和亚马逊快速推进的步伐来看,智能语音助手前景无限,一个属于智能语音交互的时代正在迅速开启。然而,我们必须清醒地认识到智能语音交互技术仍然处在非常初级的阶段。

首先,语音识别的准确率仍有待提升。去年,在锤子科技的M1手机发布会上,CEO罗永浩高调地演示了锤子手机内置的科大讯飞语音输入法,并声称语音识别准确略高达97%。不过,根据笔者实测来看,识别准确率远低于这一数值。这是因为语音识别技术对于环境的要求十分苛刻;背景噪音、口音、语速、特定领域的专有名词等因素都会对识别准确率造成显著的影响。因此,在当前技术水平下,语音识别技术的使用范围仍十分局限,使用体验也仍有改善空间。

其次,在正确识别用户发音的前提下,机器是否真的能够理解用户想要表达的真实含义呢?众所周知,人类口语跟书面语言有着巨大差异,与计算机可读的二进制编码或者字符序列更是天渊之别。把富有个性化的人类口语转化成机器语言是一件十分浩大的工程,我们目前取得的成果尚十分有限。相信大家都对几年前风行过一阵的手机语音助手还有印象,彼时不少人热衷于“调戏”Siri等手机语音助手,但很快便感到兴味索然。因为这些语音助手一问十不知,实在太笨了。毫无疑问,几年过去,Siri们已经取得了巨大的进步,但只要它们的出错率高于5%,对于用户体验的伤害便是无法挽回的。

当然,即便所有的技术现在已经足够成熟,用户们也没做好接受它们的心理准备。没有人愿意对着冰冷的机器说话,然后得到毫无感情的的回应。用户希望从语音助手那里得到的,不仅仅是迅速准确的反馈,还有富有个性和感情声音以及与人类交流时的亲切感。

此外,人在与系统做交互的时候,能记住的信息只有10秒左右。举一个常见的场景,拨打银行的客服电话时,你必须集中精力听语音播报,一旦被打断就又得从头听一遍。这些都是我们在正式跨境语音交互时代的大门前必须面对和解决的问题。

不过,我们也不必为此感到灰心和丧气,随着技术的飞速发展,大多数问题在不远的未来都将得到解决。届时,语音交互或许不是能够应对所有场景的唯一交互方式,但在脑波控制技术成熟之前,它必然是大多数场景下的最佳选择。就目前而言,语音交互技术为我们提供了更多的选择,而且在某些场景下,比如通过Echo智能音箱控制客厅的灯光,语音交互技术到来的用户体验已经大大优于手机APP和面板开关了。

我们有足够的理由想象这样一个场景:某个周日的早上,我们起床后,家里的智能音箱自动给我们播报当天的天气状况;冰箱里的牛奶只剩最后一盒时,语音助手会主动询问是否需要添购;得到肯定答复后,语音助手已经安排快递在约定好的时间送来,而你所要做的就是慢慢享用……

声明: 本网站所刊载信息,不代表OFweek观点。刊用本站稿件,务经书面授权。未经授权禁止转载、摘编、复制、翻译及建立镜像,违者将依法追究法律责任。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存