深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿( 三 )
但语音助手的交互体验上 , 还存在着或多或少的问题 。 比如 , 在车厢内风噪、胎噪、多人会话的场景 , 语音识别不准确;再比如 , 对行车中的特定语音控制命令和对话内容理解不到位;还有 , 不能与车内的仪表盘控制系统整合在一起 , 等等 , 都极大的影响了用户的体验 。
亚马逊 Alexa 最近的一份调查显示 , 在各项车载语音能力中 , 车载语音识别满意度最低 。 这也折射了车载语音场景的复杂度 , 相对家居场景 , 要复杂的多 。
本文插图
△ 亚马逊 Alexa 车载语音满意度调查(来源:Voicebot)
前三年的探索 , 让我们看到了 , 不单是手机等智能设备在车载场景的交互方式受限 , 更重要的是 , 将通用语音助手移植到车载场景的做法 , 存在着很多的局限 。 要打造体验更好的车载语音交互系统 , 必须要针对车内场景做深度的定制和优化 。
车载语音 , 前装是关键 , 但并不简单
我们再回顾过去 3 年 , 在大众汽车集团和出门问问联姻后 , 看出门问问是如何解决如上的问题的 。
当时很多媒体将这一联姻当做一次融资事件解读 , 其实 , 更重要的意义是 , 别家还在各车厂拜访打关系的时候 , 出门问问已经稳稳的攥到了前装市场的门票 。
前装的方式能够解决后装智能设备的诸多问题 , 包括针对车载环境的语音交互效率 , 以及车载设备的控制等等 。
出门问问创始人李志飞曾经表示 , 出门问问 AI 研发团队「70% 的精力花在前装车载语音交互技术的打磨上」 。 一方面是因为大众汽车集团的要求非常苛刻——问问的工程师描述为「近乎到变态」 , 另一方面 , 尽管需求不断提升和变化 , 但问问的研发团队都给予了「超乎预期的」满足 。 现在看来 , 尽管一路坎坷 , 但「前装」策略还是很快见到了成效 。
2018 年 , 出门问问的车载核心 AI 语音交互技术已通过旗下合资子公司大众问问落地于江淮大众 SOL(思皓)E20X 的前装中 , 大众问问还与德赛西威联合打造并发布了智能车机产品 。
本文插图
△ 德赛西威-问众智能车机
据官方透露 , 截至目前 , 出门问问主导研发的车载语音交互系统已经落地在大众汽车集团旗下新迈腾家族系列、帕萨特、奥迪等多个主流车型 , 2020 年预计将落地 100 万辆全新汽车 , 若以此增速 , 到 2023 年将可落地近 1000 万辆 。
本文插图
△ 出门问问车载语音交互系统落地车型
两年多的时间里 , 出门问问研发了一整套离在线结合的嵌入式车载语音交互系统 , 实现了完整的语音交互 , 包括前端信号处理、固定唤醒词、自定义唤醒词、快词指令(比如车载地图控制和音乐控制命令)、语音识别、自然语言理解、对话管理、语音合成等 。
如何理解离线混合呢?我们在行车的大多数状况下 , 使用的是移动蜂窝网络 。 尽管大部分的高端车已经实现了 100% 的网络渗透率 , 但仍有很多诸如隧道等复杂的网络环境让我们处于离线状态 , 这个时候只支持在线的系统就无法即时反馈语音交互需求 。
而有了这套离线和在线的混合系统 , 驾驶者不仅能在离线情况下 , 使用车内语音交互来实现多种车控功能 , 同时也能够快速触达多项服务 。
为应对车规级的严苛标准 , 出门问问将系统内存控制在 450M 以内 , CPU 占用低 , 整体响应时间快 , 在识别效果、播报体验、响应时间、资源消耗等目标中 , 都达到了非常好的数据指标 。
值得一提的是 , 出门问问首次在前装系统中实现了全场景打断(all-scene barge-in)、自定义唤醒词、无间断连续查询(one shot)、智能等候(always on)等众多功能 , 语音交互能力获得了极大的提升 。
推荐阅读
- 汽车知识|10万买国产家用MPV选谁?这款把语音控制玩出花的车一定不能错过
- 宝马|8万级最“聪明”的SUV,可语音控制、自动驾驶,买它无人后悔!
- 网上车市|玛莎拉蒂Ghibli轻混版首发 搭2.0T+48V/带车载微信
- 旅客|【聚焦】香港新增确诊创单日新高,深圳湾口岸日均3000人入境!
- 深圳新闻网|惊艳!深圳湾超级总部基地中央绿轴与片区景观系统设计最强方案出炉
- 江下办公|电脑端怎样将文字变成语音?推荐软件:闪电语音文字转换器文字转成语音的操作方法:
- 生活技巧|烟灰缸空气净化器,三分钟车载净化,高浓度负离子轻松吸附二手烟
- 太平洋汽车网|全新奔驰S级MBUX车载系统发布 再次发明车机!
- 紧凑型SUV|车载微信是加分项,但福特领界S更令人称赞的是动态表现?
- 新智驾|从物理按键到车载大屏,人车交互的未来还有哪种可能?