最后我再介绍一下我们近期开展的基于序列到序列模型框架的非平行语音转换方法的研究工作 。 虽然前面介绍的VCC2018方法可以取得较好的非平行语音转换效果 , 但是其仍存在一些不足 。 例如 , 基于语音识别器提取的文本内容表征中难以保证不含有说话人相关信息、语音识别模型和转换生成模型没有联合训练、仍采用帧到帧映射的模型框架等 。
因此 , 我们提出了一种基于表征解耦的序列到序列非平行语音转换方法 。 该方法在序列到序列建模框架下 , 可以实现对于语音中文本相关内容和话者相关内容的有效分离 。 其核心思想如图所示 。 在训练阶段 , 利用识别编码器和话者编码器分别提取语音中的文本和话者相关表征 。 同时我们通过训练准则的设计保证这两种表征相互独立 , 不会纠缠 。 在训练过程中 , 我们也会利用语音对应的转写文本 。 从转写文本中提取的信息可以为从语音中提取文本表征提供有效参考 。 在合成阶段 , 通过组合从源说话人语音中提取的文本表征 , 以及目标说话人的话者表征 , 可以实现从源说话人语音到目标说话人语音的转换 。
推荐阅读
-
-
农业资讯|别惹这4种“是非”,看着有面子,却是痛苦的开始,人到了50岁
-
杨幂:“男人的尽头是郭麒麟”,网友:郭麒麟双商很高,很适合!
-
-
「游戏日报」连腐团儿都来了?,轩子都没信心拿第一!网游举办选女神大赛
-
「蘸料」吃火锅时,只调这“3种蘸料”的人,老板表示:不是内行就是吃货
-
■华为P40全球发布会21:00点开启 倒计时海报一览
-
双鱼座|12月,放不下,逃不开,挣不脱,3星座痛彻心扉,难舍心中执念
-
「检查」安检员双手十分钟一消毒 上海虹桥机场“五一”完善常态防疫
-
上海法治报|退休女子花光30万积蓄住五星级酒店,挥霍后抢金店:想去监狱里生活
-
出鞘军情▲是否意味着开战?金一南:3大迹象证实判断,B1B轰炸机罕见赴日本
-
尤娜娜时尚手册|秋季的衬衫怎么穿显精致?这些小技巧很有必要了解一下!
-
想好好做医生的胖子TB不一定都是腰突导致的!医生给您详述其他病因,后腰、下背部疼痛
-
朋友圈晒美食经典语录加图片,配自己做的美食图片的朋友圈句子-
-
小豆浆妈妈育儿说|你还敢用偏方吗,宝宝晚上高烧不退
-
-
-
失主|好人有好报!环卫工捡10万现金上交获奖5000
-
请问大家,北京七处世界遗产地分别是哪还有北京的5a景点又在哪
-
|女子价值880万大别墅仅挂18元甩卖,还送2万平方米土地