[]Alexa 更新语音风格,长句式朗读听感更加自然,试听一下吧
文章图片
文章图片
深度学习方法用作 TTS 而带来的语音助手表达力的提升
- shenzhenware -
据研究机构 Omdia 的最新报告 , 在 2020 年第一季度 , 北美智能音箱(含带屏)市场较去年同比增长了 6% 。其中亚马逊及其支持 Alexa 的设备出货量占整个统计数据的 56%(约 610 万台) , 远超 Google 旗下智能音箱和苹果 HomePod 的出货量 。
分析师认为 , 虽然目前全球范围内都在受新冠疫情的影响 , 但智能音箱的用户市场仍有强大的消费动力 , 尤其是带屏类音箱 , 同比增幅在 220% 左右 。而其中 , 亚马逊的带屏音箱设备占 70% 的份额 。
文章图片
文章图片
而在强劲的市场形势下 , 为了进一步优化语音交互的体验 , 今天 , 亚马逊宣布了在语音交互上的新成就 , 语音助手 Alexa 有了新的语音风格 , 加强了对长句式朗读的听感 。
据亚马逊官方介绍 , 这种长句式的朗读的实现 , 是通过对文本的深度学习(Deep Learning) , 在文本转语音(TTS)的模型上 , 对 Alexa 的表达进行训练 , 让它的发音跟自然 。Alexa 去年曾更新了新闻和音乐内容的朗读技能 , 并且能够表达「失望」和「兴奋」的情绪 。
我们试听一下:
从两个音频内容的听感来看 , 可以明显感觉到优化后的语音更加流畅 , 停顿自如 , 也有一定的情感体现 。
亚马逊计划将新的语音风格应用在其 TTS 服务平台 Amazon Polly 中 , 并开放给开发者用于新的语音技能的开发 。用户也可以在 Alexa 的设备上选择不同的话语风格进行播报新闻、收听流媒体内容等 。
值得一提的是 , Google 前段时间 , 也是强调了语音助手的长句阅读能力 。目前 Google Assistant 的长篇文本阅读可以支持文章阅读 , 但将来有可能会扩展到包括电子邮件在内的其他内容 。
文章图片
文章图片
这两家语音巨头的表现 , 让我们看到深度学习方法用作 TTS 而带来的语音助手表达力的提升 。尽管让 AI 完全像电影「Her」中萨曼莎讲话还有一定的挑战 , 但针对场景化的训练 , 还是可以获得更加自然的声音的 。■
【[]Alexa 更新语音风格,长句式朗读听感更加自然,试听一下吧】主笔:陈宇凡、陈壹零 / 深圳湾
推荐阅读
- 「三星」三星Galaxy Z Flip系统更新 “三脚架”模式越发人性化
- 牡丹江涂鸦智能■智能家居语音控制系统
- [用户461430234816244]手机总是提醒更新系统, 用不用每次都更新? 维修师傅如是说
- 『微软』微软win10推出04更新,提升安全性和修复局域网IP重置
- [香港新天域互联]三星Galaxy Z Flip迎来系统更新:“三脚架”模式取景器可上下翻转
- #预览版#NVIDIA推出首个DX12 Ultimate驱动更新
- 【语音】Siri不够聪明,再给它一双眼吧!CMU与苹果合作,摄像头让AI助手更精确
- [zol中关村在线]NVIDIA推出首个DX12 Ultimate驱动更新
- 【】除了支付宝,这些顶尖品牌更新案例你了解多少?
- 『』三星 S20 Ultra猎户座版本更新系统出现绿屏现象,国行版暂未发现