最后我再介绍一下我们近期开展的基于序列到序列模型框架的非平行语音转换方法的研究工作 。 虽然前面介绍的VCC2018方法可以取得较好的非平行语音转换效果 , 但是其仍存在一些不足 。 例如 , 基于语音识别器提取的文本内容表征中难以保证不含有说话人相关信息、语音识别模型和转换生成模型没有联合训练、仍采用帧到帧映射的模型框架等 。
因此 , 我们提出了一种基于表征解耦的序列到序列非平行语音转换方法 。 该方法在序列到序列建模框架下 , 可以实现对于语音中文本相关内容和话者相关内容的有效分离 。 其核心思想如图所示 。 在训练阶段 , 利用识别编码器和话者编码器分别提取语音中的文本和话者相关表征 。 同时我们通过训练准则的设计保证这两种表征相互独立 , 不会纠缠 。 在训练过程中 , 我们也会利用语音对应的转写文本 。 从转写文本中提取的信息可以为从语音中提取文本表征提供有效参考 。 在合成阶段 , 通过组合从源说话人语音中提取的文本表征 , 以及目标说话人的话者表征 , 可以实现从源说话人语音到目标说话人语音的转换 。
推荐阅读
-
-
-
-
『萌宠大机密』靠实力成为家用车,极好的行驶品质,高尔夫·嘉旅
-
-
佰咖汽车:一汽丰田推卡罗拉长轴距车型 首搭1.5L三缸动力,轴距将加长100mm
-
青海生活资讯|家长抡起凳子就砸,伤及无辜小孩,两名儿童玩耍时因琐事发生矛盾
-
比亚迪|撇开品牌溢价能力不谈:比亚迪「汉」与BBA相比如何呢?
-
考拉科技馆:苹果确认iOS将发生改动,果粉无奈“捶胸”安卓用户:一起享受吧
-
-
苹果|史上“最长寿”的苹果手机:上市3年半,居然有足足2亿用户!
-
-
广末凉子|广末凉子认偷吃“让我哭又舒服”,陈沂力挺再扯谢忻被轰双标
-
『苹果』苹果官方商店泄露玄机,iPhoneSE即将上线,4.7寸真香
-
央视新闻|卡塔尔新增243例新冠肺炎确诊病例 累计达117008例
-
-
【海峡军志号】普京向白宫释放强硬信号,国际观察丨一国叫板六国?关键时刻
-
补欠缺和瑕庛|推荐的食物,排出毒素,健胃消脂,改善血脂血糖,女性到中年后
-
-
车家号|最大功率140kW,最大扭矩320Nm,航程450km,奔腾E01北京车展发布