技术|百度吴甜与浙大学子“云见面” 人工智能的妙用远超想象

90分钟超时放送、1.4万字干货解读 , 这位人工智能行业的稀缺女将 , 究竟返校说了啥?7月2日 , 浙江大学第二期“互联网+”创新创业大讲堂准时“云端”开课 , 百度集团副总裁吴甜作为本期主讲嘉宾为学弟学妹们带来《人工智能技术的实践与创新》的分享 。
时值毕业季 , 百度吴甜以浙大师姐的身份开启了在线讲堂 , 以百度的工作为例 , 生动又系统的讲解了人工智能技术的实践与创新 , 帮助学弟学妹们加深对人工智能行业的了解 , 并解答了关于AI技术发展的专业问题 。 在线收听的浙大师生们频频向这位新晋“技术流主播”双击点赞 , 不少参与者在收听分享后 , 纷纷表示不过瘾 , 希望师姐“加更” 。
近十年 , 人工智能逐渐走入人们的视野 , 成为大热风口 , 但在此之前 , 吴甜就已经专注于人工智能领域多年 , 且见证了NLP等基础技术的快速发展 。 此次 , 吴甜从百度AI技术展开 , 详细介绍了百度大脑的技术布局 , 从领先性及易用便捷角度介绍了作为重要开发工具的深度学习平台飞桨 , 以及语义理解技术解决方案文心ERNIE和智能对话定制与服务平台 UNIT , 并围绕新冠疫情带来百度AI在战疫方面的突出表现 。 在分享最后 , 吴甜也针对听课群体的特点 , 描绘了深度学习开发者的学习地图 , 介绍了AI Studio学习实践社区、各类AI大赛、亿元算力支持、AI人才认证、就业、PPDE计划等百度在AI人才培养方面的诸多举措 , 希望帮助更多学弟学妹通过飞桨的社区和平台能够与更多的开发者交流 , 收获成长 。
技术|百度吴甜与浙大学子“云见面” 人工智能的妙用远超想象
图片

百度天然具有AI基因 , 百度大脑是百度AI技术多年积累和业务实践的集大成者 。 吴甜介绍 , 百度大脑由基础层、感知层、认知层和平台层以及AI安全组成 。 基础层为大数据、算法以及算力的支撑;感知层包括语音、视觉以及AR、VR等能力;认知层主要包括自然语言处理和知识图谱;平台层包括飞桨、百度大脑开放平台等 , 助力AI应用创新;此外还有AI安全技术进行保驾护航 。
语音技术作为重要的基础技术 , 一直保持高速发展 , 吴甜用视频案例为大家展示了语音技术的发展水平 。 基于百度自主研发的SMLTA 流式多级截断注意力模型 , 语音识别准确度大幅提升 。 2019年百度输入法发布会上 , 一段中英混杂的“职场rap”被百度输入法准确识别 , 语音识别已达到中英文自由切换均可高质量识别的水平 。 在一段“调戏”小度音箱的视频中 , 打开小度的极客模式 , 不仅不需重复“小度小度”唤醒词 , 小度还可以准确区分对话与需求 , 而这正是全双工免唤醒能力的体现 , 在此能力下 , 人机交互越来越顺畅 。 吴甜还为大家播放了多种不同风格的音频 , 而这些可以媲美人声的音频都是由AI语音合成 , 并通过风格和音色迁移技术实现的 。
小浦、移娃等数字人小姐姐的出现 , 收获了现场一大波点赞 。 在谈到虚拟形象合成技术时 , 吴甜播放了一段数字人合集视频 , 来自百度智能云与浦发的小浦、中国移动的移娃、澎湃的小菲等虚拟数字人都源于相同的虚拟形象合成技术 , 但形象风格各不相同 , 在百度技术的支持下虚拟数字人“女团”也将走入更多行业 。
除了类比人的感知能力的语音视觉技术 , 还有类比人认知能力的语言与知识技术 。
技术|百度吴甜与浙大学子“云见面” 人工智能的妙用远超想象
图片

吴甜详解了基于知识图谱的视频理解 , 在感知技术提取特征的基础上 , 融合了知识推理和计算 , 对整个视频的内容有更深度的理解 。 此外 , 语言和知识技术在医疗行业的应用 , 也可以在辅助诊疗、合理用药、病历质控等场景起到切实的帮助作用 。 百度研发的ERNIE全面刷新了NLP多项任务的效果 , 机器同传方面 , 百度先后提出了一系列新模型 , 在语音容错、平衡质量与时延、语篇翻译连贯性和端到端同传模型等方面取得突破 , 并研发了高质量、低时延的机器同传系统 。 在疫情特殊时期 , 支持了多场远程会议直播的同声传译 。


推荐阅读