VUI产品模块v290Pub
V290Pub 是V290 的升级版,包含了V290 的所有功能并且具有更好的识别效果。经过一年多的量产,与大客户之间互动改进,V290Pub可以迎合目前在智能家居产品中绝大部分工业客户的实际需求,识别效果被客户认可,并达到了批量商用的要求。V290Pub 主要面向量产厂商,提供更加低成本的产品模块。
V290Pub使用了最新的语音识别芯片技术,内置降噪模块和识别打分模块(提供错误据识别功能),可以提供远场识别与录音,同时降低“误识别”与“误触发”两类错误,带给用户更好的识别效果。V290Pub 可以集成到客户的产品中,无需另外开发和生产的过程,实际量产的价格比芯片更划算。
V290Pub支持备受量产客户欢迎的VSR 识别流程编辑器,使产品开发者可以轻松地实现各种复杂的识别流程(对话流程)以及与其他硬件进行交互,成为稳定独立运行的识别传感器。
基于V290Pub模块,还可以提供婴儿哭声检测等特征声音识别功能,英文识别功能,以及针对产品作特殊识别优化功能。
点击下载V290的文档和编辑器。
购买请发送邮件或者电话联系。
V290Pub支持更多的功能
远场识别与远场录音;
识别打分
英文识别
婴儿哭声检测的插件;
特殊优化插件;
通过Uart 送出语音流,方便开发者上传到云端服务器进行识别;
通过Uart 直接播放语音流,方便开发者灵活播放;
变声播放,修改播放速度;
通过串口修改命令词;
录音;
一、V290Pub 典型应用
经过在过去近一年时间内与几家智能家居公司的合作和开发,V290Pub 主要针对的是相对安静的室内环境下的应用,如空调/温控器、灯、窗帘、净化器等家居产品上。
V290Pub 应用在空调温控器上时,用户只需说出“打开空调”的指令,模块识别出后,通过UART 输出开启空调。
或者,在本地通过语音识别触发后,通过V290Pub 提供语音流,上传到云端进行识别。
根据我们与客户的讨论,在智能家居最适合语音识别的场景是:
1. 产品距离人2~3 米
2. 每天操作4~5 次
3. 每次操作的语音指令<10 条,可以脱口而出。
4. 比如:空调/温控器、灯、窗帘、净化器/加湿器、卫浴设备,等。
二、V290Pub 性能和特点
1. 本地&远场识别
V290Pub 可以在本地提供语音识别,不需要通过网络和云端在线识别。
V290Pub 一般可以应用在5m 以内的距离,在安静的室内可以达到8m 的操作。
识别距离与灵敏度都可以通过VSR 进行设置,比如嘈杂的展会现场,建议识别距离参数设置为10cm-20cm。
2. UART 输入修改识别词
V290Pub 支持通过UART 修改命令词,方便厂商增加界面让终端用户随时修改识别列表。
3.UART 输入输出控制
用户通过VSR 来自由编辑Uart 的输入和输出的内容。
用户可以通过UART 输入参数,实现外部数据输入的功能。
典型应用:使用语音控制空调,如温度调节‘升高2 度’等指令,由语音识别出后,通过UART 输出控制空调温度;
如果客户还需要知道空调当前的温度,则可以将当前温度由UART 输入,再由语音播放出来。
4.远场录音
V290Pub 提供了录音的机制,可以在执行VSR 进行识别的同时,把现场的声音上传到云端服务器进行识别。
5.识别打分,防止误触发
V290Pub 对每次的识别结果提供了一个分数,最高为100 分,这个分数可以理解为识别匹配的程度。当识别结果为80 分说明比识别结果50 分时要发音更准确。
用户可以使用这个分数来设定阈值,只有识别分数在某个阈值之上的识别结果才作为有效的识别结果,从而有效地对误触发进行消除。
6.提供英文识别
针对英文语音识别,可以选用我们的V590Pub 模块,V590Pub采用了北美口音的英语为标准模型。
并且用户可以自由修改识别词语。
7.提供优化定制
V290Pub 支持优化插件,使得用户后续可以根据产品特点来定制特殊优化,从而达到和国际大厂商一致的识别效果。
一些国际大厂,出于对识别效果的严格要求,会要求根据自身的产品设计,对识别词语再进行特殊优化,这样的优化结果会形成一个插件,在V290Pub 的编辑器中插入该插件,就可以获得卓越的识别效果。
8.特殊声音识别—婴儿哭声
V290Pub 默认集成了婴儿哭声检测的插件。
厂商可以定制其他特征声音检测的插件。
9.提供了对IO 管脚的批量输出和输入
V290Pub 提供了15 个IO 口(7 输入8 输出)与其他设备进行交互。用户通过VSR 自由编辑IO 口的内容。
同时提供了批量操作的指令对IO 口进行批量输出和批量输入进行操作。
10.两种工作模式
V290Pub 可以在两种不同的方式下工作:
主动方式(主机模式):上电后即执行预先设置的VSR 流程。
被动方式(从机模式): 在运行VSR 的同时,外部的主控单片机可以通过Uart 传入拼音串来更新识别列表。
11.工作稳定
V290Pub 经过国际大客户非常严格的测试,工作稳定。连续7*24 小时工作,实现真正的随时倾听。
12.尺寸与外形
我们可以根据客户的要求修改V290Pub 的形状、大小,只是需要额外的费用,并且对起订量有一定的要求。