「用户」腾讯多媒体实验室商世东:咬咬牙也要跟上新版本的发布( 四 )


5.硬件
1+1>2
「用户」腾讯多媒体实验室商世东:咬咬牙也要跟上新版本的发布
图片

(Photo by Sergey)
国内有非常不错的硬件制造商 , 深圳就有很多了 。 我们和这些硬件制造商合作的时候 , 怎么互相之间博采众长 , 产生一加一大于二的效果 , 这里面其实有很多合作的空间 。 腾讯会议在很多场景里面是要跟不同的合作伙伴联合打造一个比较好的会议体验的 , 而这些合作伙伴在他们的相关领域里面 , 像硬件领域、网络领域的未来发展是怎样的 , 有什么有前景的趋势 , 哪些变化在酝酿当中、又会什么时候发生 , 都是我们要持续关注的问题 。 比如 , 我们看到麦克风不断有新技术材料出来 , 那相关制造商的路线规划是什么 , 某些技术难点突破了以后会对视频会议云通信的产品有怎样的影响 , 这些都需要你拥有很好的前瞻性 。
另外 , 我们一直比较关注相关的领域 。 比如 , 5G时代整个接入网络带宽上去了 , 那我们就思考当接入带宽不再成为瓶颈以后 , 可以在哪些用户体验上做进一步的优化 。
像之前提到的教学场景 , 老师们可能有些高品质的音频需要传输 , 不仅仅是语音 , 还有基于音乐的特定场景 。 比如老师给学生放一段视频 , 视频里面可能不仅仅有对话 , 还会有高品质的音乐 。 那么对于音乐来讲 , 面临的挑战是不一样的 。 音乐的内容特征、频谱、码率需求 , 从音质体验的角度来说比语音要求要高 。
这样的诉求在3G、4G网络视频会议下由于带宽的限制、网络的拥塞可能不得不放弃 , 但在5G的时候就会提上日程 , 要研究如何在新的场景下满足用户更多的需求 , 从而去优化他们的体验 。
另外 , 基于AI的技术 , 我们也看到音频视频两者多模态可以更好的结合起来 , 能够大大往前走一步 , 给用户更好的综合体验 。 同时 , 计算能力上来以后 , 你会发现很多事情做起来受限于当时的设备 , 而现在慢慢都成为了可能 , 我们在思考怎么把这些事情一步一步做起来 。 我们现在和硬件厂商的很多合作 , 已经在紧锣密鼓地开展了 。 腾讯会议本身可以提供很好的音视频处理、传输、编解码技术 , 我们的硬件合作伙伴也有一些他们专有的硬件上面的特色功能 。
第一步 , 我们之间要先相互打通 。 直接打通第一步以后 , 我们要思考怎么把自己的技术和对方的优势结合 , 这里面有很多工作可以做 。
举个例子 , 用户的设备跟我们腾讯会议软件 , 不管是通过有线网络还是USB进行连接 , 以前在用户设备上受限于运算能力做不到的事情 , 现在就可以做到了 。 因为通常我们讲的会议电话这样的产品 , 它的运算能力、内存总是受限的 , 很多基于AI的算法做不到 。
但是腾讯会议的APP跑在我们通用的、运算能力强大的设备里面(像电脑)就不存在这样的限制 , 尤其是和云结合起来后 。 一旦和硬件厂商打通以后 , 双方找到彼此之间的配合点 , 以前做不到的事情现在都成为可能 , 典型的例子比如会议内容转录、整理会议纪要等等 。
像一些传统的视频会议方案提供商 , 它本身是一个闭环 , 它的解决方案里 , 软件硬件全都是它自己的 , 不存在运营多样化的挑战问题 , 因为每个链条它都自己把握 , 这样质量有保证 。 但是相对而言 , 他们的完整解决方案的价位也比较高 , 兼容性也会是很大的问题 。
腾讯会议的话 , 要跟所有设备商都可以接入 , 面临着保证可靠性、稳定性、安全性的挑战 , 因为不同的厂商的产品要在它的性能范围之内互相协同 , 无缝连接 。
在安全性方面 , 我不是专家 , 但从开发SDK的角度来说 , 我们对于用户本身的信息肯定是不做收集的 。 对于用户谈话 , 比如交流的具体内容 , 我们也不会做任何收集 , 只是用算法对这些内容的统计信息进行收集 , 包括通话过程当中的质量 , 比如是否失真、嘈杂、有卡顿等等 , 这些都是从技术方面统计的信息 。


推荐阅读