绘声公司的VUI模块,在人们双手被占用时,用语音指令来控制身边的电器。
硬件实现VUI模块,运行稳定,成本清晰,内置降噪算法。
VUI流程编辑器提供超级强大的流程脚本编辑能力。


Siri的出现,实际上起到了教育市场的作用,使得大家都明白,VUI就是Voice User Interface,就是语音用户界面,通过语音来和机器设备进行互动操作。
由于语音交互的独特性,使得VUI的思路和传统的基于按键和触摸的人机交互完全不同,VUI如果只是简单地拷贝按键的方式,那么并不会给产品带来很好的用户体验。

一、VUI研发中几个问题的讨论

李开复博士曾经总结VUI的几个问题:
1.     在某个产品领域,VUI可以解决什么真正的用户需求和痛处?
2.     怎样让开发者介入开发各种应用?
3.     降噪的问题。
4.     语音识别的成本谁来承担。
5.     用户对于“语音交互”会有比较大的心理预期,天然有着更大的期望值和要求,如何用巧妙方式来降低这种感受。
资料来源于网络

这几个问题,实际上非常实际地指出了VUI发展的艰难。正如在"语音识别技术"中说明的,目前并没有出现一个理论模型来描述人自身是如何“听懂”语言的。人连自身语音识别的机理都没有研究明白,去想设计完成人工智能来完成语音识别和理解,更是处于漫漫长路的探索中。
因此,在目前的各种VUI研究和开发中,人们更多的还是摸索和实验。无法实现真正可以智能地与人语音互动的应用。

绘声公司是提供硬件的VUI模块产品,基于的是关键词语的语音识别技术。
针对李开复博士的几个问题,绘声公司的产品是这样定义自己的产品路线:
1.     绘声公司的VUI模块,就是在智能家居领域和工业控制领域,在人们双手被占用的情况下,让人们可以用简单的语音命令来操作身边的电器工作。

2.     绘声公司提供了标准的VUI硬件模块和编辑器,任何开发者和终端用户都可以使用编辑器来灵活地开发和修改识别流程的对话内容。从而根据自己产品的实际需求,来把VUI模块引入到产品中。

3.     由于是硬件实现VUI模块,所以绘声公司完全掌握整个模块的设计和硬件采购:电路板的布线上,尽量减少咪头到芯片的电路长度和串扰。反复实验多种咪头,最终选定最适合的供应商。以及加上绘声公司独有的降噪算法技术,尽可能地把降噪功能实现好。

4.     绘声公司的硬件模块,无需联网走云端,所以成本是清晰的,没有后续使用成本。而且绘声公司会不断改进生产工艺,尽量地降低标准VUI模块的成本,争取让各种电器都可以引入这一模块。

5.     绘声公司的VUI模块,本身定义的功能是简洁清晰的,不承担“语言理解和智能对话”这样的功能,因此在产品说明上也就会直接告诉终端用户使用时的要求,避免了终端用户对于功能的过高预期。同时,VUI编辑器提供的编辑功能,可以帮助厂商在设计VUI流程时,尽量给出清晰的语音提示,来引导终端用户按照语音提示的说明直接说出语音命令进行操作。

二、绘声公司提供VUI系统供开发者研发合适的VUI流程

为一个产品增加VUI功能,并不是简单地用识别芯片或者是把android系统上的识别APP调试通过就算完成,而是要根据产品特点,实用环境的噪声,以及人们的使用习惯,来仔细地设计语音交互的流程。既要保证简洁好用,又要尽量避免误触发。
绘声公司最核心的技术是提供了VUI操作系统和VUI编辑器。这样就是为了让开发者和生产厂商可以按照最适合产品特点的方式来编辑VUI模块的识别流程,从而获得最佳的用户体验。

比如在智能家居的中控遥控器中,有的遥控器是采用iPad的解决思路,使用大屏幕触摸屏来解决。 有的遥控器还是传统的按键式的遥控器。
按键遥控器就适合引进VUI模块,这样就可以避免在小遥控器的表面设置过多的按钮,只需要设置大大的一个“VUI”语音按键,每次要使用时,按下按键,听到“嘀”提示音后的8秒钟时间内,说出指令,比如”打开卧室空调“,”关闭全部“等等,就可以操作了。
这样的按键方式就是适合在没有操作屏幕使用干电池的遥控器中使用,每次按键后才进行识别运算,可以有效地节省用电并且避免误触发。同时,给遥控器的工业设计和开模带来很大的方便。
同时,在细节上要注意调节
1)     识别距离应该调整的比较近,因为人们手持遥控器一般距离嘴巴比较近,而且使用环境可能会是在嘈杂的电视前面。把VUI模块的识别距离设置的比较近有利于屏蔽其他噪声的干扰。
2)     每次按钮后,应该给一个期限,比如最长不超过10秒钟接收语音指令,避免误触发按钮后造成的电力浪费。这个可以通过VUI流程编辑器来方便地实现。
3)    遥控器可以内置两种方式,由终端用户进行选择:一种是识别到后立即操作,一种是识别到后,把识别指令回放出来,用户如果认为无误则直接再按一下按钮进行确认,否则在5秒钟时间内不按按钮则此次识别无效。
这些细节,将极大地适合遥控器这种产品的操作特点,提升终端用户的使用体验程度。

对于其他的产品,也要分析产品的特点和用户使用的需求,来认真地设计VUI流程,注重细节。提供终端用户使用体验良好的”语音用户界面设计“。

这些讨论,在ICRoute网站上有文档作了非常详细的说明讨论,可以借鉴。
同时,也可以阅读“语音用户界面设计”来了解基于绘声电子的V280标准VUI模块如何实现各种语音界面的流程设计。