小智:这是两会上知识最丰富的女主播,央视网AI主播上岗

“你好 , 欢迎来到对答如流 , 两会‘智’通车 。 ”一位面带微笑的女主播在屏幕中 ,
【小智:这是两会上知识最丰富的女主播,央视网AI主播上岗】向用户打着招呼 , 但是 , 这位主播并不是真人 , 而是AI主播“小智” 。 “小智”主持的两会“智”通车 , 是一款由百度智能云和央视网在两会期间联合打造的全国首个集智能对话、语音交互、社交分享于一体的时事AI产品 。
小智:这是两会上知识最丰富的女主播,央视网AI主播上岗
文章图片

5月21日起 , 全国正式进入两会时间 。“两会”的主题是什么?全国人大政协委员任期是多久?我们国家的奋斗目标是什么?随着两会召开 , 这些问题受到人们的关注 。 为了向公众普及两会知识 , 百度智能云携手央视网 , 共同推出了两会“智”通车 , 依托百度成熟的人工智能技术 , 以AI主播发问的形式带领参与者回答问题 , 了解国事 , 近期获得了网友们高涨的参与热情和一致好评 。
小智:这是两会上知识最丰富的女主播,央视网AI主播上岗
文章图片

点开两会“智”通车的链接页面在AI主播“小智”的带领下进入答题之旅 。 答题环节共有五道题目 , 内容涉及两会历史、国家政策等话题 , 参与者在10秒钟内作答 , 最终用户可以根据答题天数获得自己的星章奖励 , 包括“智慧好学星 , 才智过人星 , 足智多谋星 , 博学睿智星 , 全能智星” 。 “小智”能够使用自然流畅的人声读出每个问题 , 用户可以通过语音回答问题 , 答案自动识别 。 对于回答错误或到时未作答的问题 , AI主播还会智能地提供相关提示 , 根据提示 , 再次提供答题机会 , 最终会给出正确答案 。
如果仔细观察“小智”的细节 , 我们会发现她的动作与神态和真人如出一辙 , 讲话的过程中微笑、自然眨眼等各种面部表情十分逼真 。 同时“小智”的口型和讲话内容实现了真实的贴合 , 面对不同的答案也有着不同的交流反应 。
在这样一位AI主播的带领下 , 参与者可在两会期间每天享受“智”通车的线上答题乐趣 。 在这种愉悦的体验背后 , 是百度智能云的强大技术加持 , 让“小智”集“人像美”、“善交流”、“懂说话”三大亮点于一身 。
小智:这是两会上知识最丰富的女主播,央视网AI主播上岗
文章图片

人像美
这次挑起大梁的“小智”外形来自于百度设计的3D高精度仿真人像 , 对话时真实感与科技感兼备 。 结合AI和计算机图形学自主研发的超写实、高精度3D数字员工驱动方案 , 支持合成语音输入 , 生成音唇精准同步、表情丰富逼真的人像动画 , 具有高泛化、低延迟的特点 , 并且支持表情风格和肢体动作的定制化 。
百度虚拟数字人基于真人录像 , 机器学习人的说话声音、唇动/表情/动作规律 , 对人像的形态和声音分别进行复制与合成;塑造3D高仿真人像 , 模拟人脸肌肉组织 , 以算法驱动人像模型的唇形、表情和动作 。 支持3D效果 , 全方位、多角度呈现 , 面部细节更细腻 , 展示更多细节;更具艺术性 , 能够对形象进行艺术设计 。
小智:这是两会上知识最丰富的女主播,央视网AI主播上岗
文章图片

善交流
“小智”在与人沟通时 , 反应灵敏 , 对话顺畅 , 这基于百度强大的语音识别及语音合成能力 。 百度ASR(自动语音识别技术)采用先进的截断注意力模型(SMLTA) , 摒弃市场上传统的Attention基于整句的服务 , 使用语音流进行截断实现完整流畅的交互 , 提升相对字准率15% , 计算速度与传统CTC技术持平 。 百度TTS(从文本到语音)运用先进的Wavenet深度学习神经网络算法将文字合成为多种语言的不同语音 。


推荐阅读