cnBeta|谷歌新系统：能在视频电话中检测到正在做手语的“讲话者”

_本文原题：谷歌新系统：能在视频电话中检测到正在做手语的“讲话者”
据外媒报道，在视频通话来说，系统是可以通过切换的方式以突出谁在说话，然而不幸的是，对于像手语这样的无声语言其则无法触发这些算法，但现在谷歌的一项研究可能会改变这一点。这是是一个实时手语检测引擎，它可以分辨出某人何时在做手语以及何时结束。
谷歌研究人员一篇在ECCV上发表的新论文描述了如何高效、几乎没有延迟地完成这项工作。如果手语检测成功了但却导致视频延迟或降级那就无法达到目的，所以他们的目标是确保模型既轻便又可靠。
据了解，该系统首先会通过一个名为PoseNet的模型来运行视频，该模型会估计每一帧中身体和四肢的位置。这个简化的视觉信息会被发送给一个模型，而该模型能根据使用German Sign Language（德国手语）的视频中的姿势数据进行训练，然后它将现场图像跟其认为的手语的样子进行比较。

本文插图

这个简单的过程已经在预测一个人是否在做手语方面实现了80%的准确率，另外再加上一些额外优化的话，准确率则达到了91.5% 。
为了不向现有电话添加新的“某人正在做手语”的信号，该系统采用了一个巧妙的小技巧。其使用一个虚拟音源来产生20kHz的音调，这虽然超出了人类的听觉范围但却能被计算机音频系统注意到。这个信号在人们做手语的时候就会产生从而使语音检测算法认为他们是在大声说话。
【cnBeta|谷歌新系统：能在视频电话中检测到正在做手语的“讲话者”】目前，该系统还只是一个演示。

cnBeta|谷歌新系统：能在视频电话中检测到正在做手语的“讲话者”

推荐阅读

酒驾|酒驾、醉驾的区别及处罚，都在这儿了，别再傻傻分不清！

连玉韵：特朗普表示海军可以主动攻击配备巡航导弹的伊朗船只

这样至少在没人陪你的时候|在男性中被当成“怪兽”，在中国却很吃香，日本这个身高的女生

毛晓彤|福建：毛晓彤大街上录节目，皮肤白皙招人围观，“泉州人不追星”

湖北人，今年刚毕业，想报考北京工商大学的会计专硕，目前在北京复习，报考点在哪

过年送老丈人500左右价位的白酒有哪些推荐

驱动之家|Cybertruck 诞生，粉丝爆改福特猛禽：燃油版

这两件呢大衣留推荐留哪件

中国新闻网|发改委：8月以来中央冻猪肉储备投放累计成交近3万吨

无量子十二生肖运势|出生在哪几个月的生肖鸡桃花最旺

三國殺|比肩神明！这些精品武将不弱于史诗武将，三国杀：凡人之身

「新华网」叙利亚总统：俄土有关叙北部的协议不是长久之计

杨树怎么能长得快长得粗杨树怎么能长得快长得粗的

怎么解除手机软件兼容，如何解除手机解析包借误

中年|12.98亿美元！上半年黄埔实际利用外资全市第一

内存|快科技2021年度评奖：内存篇

有幸同行，不负遇见！名师联盟阶段总结

枝头的喜鹊|王鸥太有“老板范”，把宽松西装穿得松松垮垮，依旧气场强盛

英国首相■英国首相：九月开学是“国家优先事项”

内马尔|内马尔离开的真正原因？巴萨前高层：与梅西无关！走后不久就想回