音频|腾讯商世东:天籁音频技术让云会议“听得见、听得清、听得真”( 四 )


除此之外 , 我们发现在整个云视频会议里面 , 我们还会有一些音乐内容 。 就像我讲的一些或者屏幕分享的时候 , 你可能会是想把一些PPT的内容或者视频的内容需要分享给对端的播放端的人来听 , 这时候这里面很大一部分内容可能是音乐内容 , 对于音乐内容来说 , 你的音质的要求可能会更高 。
音乐的内容的话 , 不论从码率来说 , 还是在采样率来说 , 相对于传统的语音来说都会丰富了很多 , 有更多的这样的高频的细节在这里面 。 所以如果不能够很有效的把音频内容检测出来的话 , 对于用户来说 , 在听到这样的视频或者音乐或者是电影内容的时候 , 那他的体验是不佳的 。 所以我们在整个天籁音频里面加入了音乐内容检测 。 可以看到 , 我们的音乐内容检测的准确率是很高的 。 我们在各种不同的端上面 , 在各种不同的场景里面 , 只要是音乐内容我们都可以达到一个非常高的这样的音乐内容检测 。 然后一旦检测到音乐内容, 现在正在通过网络传输 , 我们会有效提升整个音乐内容的音质 。
另外 , 还有就是我们在整个我们讲云视频会议场景里面 , 其实碰到比较多的一个挑战 , 就是同地多设备现象 。 在以前的这样的一个传统的视频会议场景里面 , 其实因为入会设备就那么几个 。 一个房间里面就一个大屏 , 就一个电话是不存在这种多设备检测入会的 , 但是现在在这种云视频会议场景里面 , 每个人都拿一个电脑 , 他电脑都会入会 , 然后同时在房间里面还会有各种传统的设备可以入会 。 这里面带来了非常大的声音挑战 , 最直观的就是这里面很容易引起啸叫 , 但实际上发生的时候问题的复杂度远远超过啸叫 , 会带来音质的损伤 , 会带来漏回声、 会带来啸叫、会带来一系列的影响整个会议体验的这样的一些问题 。 然后我们在这里面 , 我们在天籁音频里面 , 我会讲到我们通过一些语音相关性的信号以及我们通过音频水印的内容 , 可以有效的检测出现在是否存在着同点多设备现象 , 以及如果发生这种现象我们可以怎么办?
音频水印技术其实跟视频的水印有相似的地方 , 就是说把水印的信息加到声音信号里面去 。 在不影响人的听觉体验的情况之下 , 能够有效的标识这段音频它的身份 , 所以我们把音频水印技术用在我们现在的同地多设备检测里面 , 显著的提升了整个同地多设备检测的这样的一个准确性 。
另外一个比较大的问题 , 在这种云视频会议里面 , 我们讲其实就是整个会议的系统的鲁棒性 。 但是我们发现在很多一些消费类产品里面 , 其实如果是使用它自己的一些厂商自研的方案 , 有时候会有漏回声现象 。 其实漏回声对整个会议音频体验的影响非常之大 , 我们为了解决这样的问题 , 我们开发了残留回声的检测技术 , 残留回声检测技术可以有效的防范整个不同的客户端设备、不同的音频外设由于它本身硬件或者软件的一些缺陷带来的这样的一个残留回声 , 然后我们的系统在发现了一个系统残留回声的时候、还可以有效的对这样的残留回声进行抑制 , 很好的弥补了一些硬件设备的不足 。
感谢大家 , 我今天的分享内容就到这里结束 。 总而言之一句话总结下来就是 , 天籁音频技术是为了云视频会议而生 。 我们针对云视频会议上面的各种以前在传统的视频会议里面没有碰到的挑战 , 有针对性的开发了多项技术 , 并且把它形成一套完整的解决方案 。 这也是大家能够现在在腾讯会议使用过程当中能够体验到的这样一个音频端到端的最佳的体验 。
谢谢大家!
(责任编辑:王治强 HF013)


推荐阅读