与非网|三菱电机开发场景感知技术，紧贴AI技术首次实现人类直观交互

三菱电机宣布，该公司开发了它认为是世界上第一项能够与人类进行高度自然和直观的交互的技术，其基础是将多模态传感信息转换为自然语言的场景感知能力。
这种新颖的技术，场景感知互动，融合了三菱电机的专利 Maisart 。紧凑的人工智能技术，通过自然语言的生成，分析多模态感知信息，以实现与人类高度自然和直观的交互。
这次，作为适用于本技术的应用程序之一，构筑了人与车载机器用自然语言进行对话的路径向导系统。

本文插图

图源：三菱电机
通过世界上第一个独特的 End-to-End 深层学习，实现人与设备的顺利沟通，端到端深度学习，只需输入和输出样本即可学习，采用摄像机拍摄的图像信息、麦克风采集的音响信息、骑手或雷达取得的位置信息等多模态传感信息，机器了解周围发生的状况。
在多模态传感信息中自动加权重要性高的信息，使用自己的多模态保持法，对机器理解的内容使用自然的语言进行详细表现的学习模型建立起来。
通过从设备理解的情况和人的话语历史中生成自然词语，实现了人与设备之间的顺利沟通。与传统的仅有视觉信息的方法相比， CIDEr 评价改善 29% 。
场景感知的汽车导航交互，一个目标应用程序，将为司机提供直观的路线指导 . 例如，该系统不要求司机“在 50 米内右转” ，而是提供场景感知指导，例如“在邮箱前右转”或“跟随灰色汽车向右转” 。此外，当预测附近的物体与汽车的路径相交时，该系统将产生语音警告，例如“行人正在过马路” 。为了实现这一功能，系统对场景进行分析，识别场景的可分辨、直观的地标和动态元素，然后利用这些识别的对象和事件生成直观的句子作为指导。

本文插图

本文插图

图源：三菱电机
【与非网|三菱电机开发场景感知技术，紧贴AI技术首次实现人类直观交互】该技术利用深层神经网络在物体识别、视频描述、自然语言生成和口语对话技术等方面的最新进展，使机器能够更好地理解周围环境，更自然、更直观地与人类互动。场景感知的交互技术有望具有广泛的适用性，包括用于车载信息娱乐的人机接口、在建筑和工厂自动化系统中与机器人的交互、监视人的健康和福祉的系统、解释人类复杂场景并鼓励社会距离的监视系统、支持公共场所设备的非接触式操作等。

与非网|三菱电机开发场景感知技术，紧贴AI技术首次实现人类直观交互

推荐阅读

女排：女排奥运冠军确定退役时间，满身伤病离开国家队，令人心疼

考生|今天，有5名考生拿到了“特殊”的考卷

经典伤感签名(伤感的个性签名)

穿搭|巴拉巴拉童装带你开启秋日格纹新视野

理想|沈义人喜提理想ONE 2021款：方向盘和座椅提升感知明显没入职理想

上海检察|金山区院开展检察建议回访活动

欧美多国出现多系统炎症综合征

穿衣搭配|范冰冰又高调“作妖”，穿金色亮面大衣配低马尾，气场强大A爆

孕育岛|身材少女感爆棚，网友：张先生啥时恢复，唐艺昕产后首次亮相活动

互联网的放大镜TB■S6发布，主打自拍，但2698元的价格还是真香，刘昊然代言的vivo

英媒|英国二季度GDP暴跌20.4%，英媒：在G7国家中最差

新华网|两部门强调农村耕地“八不准”“一不得”

夫妻的世界@韩国影视剧审核的如此宽松，为什么还要处罚《夫妻的世界》? 网友：三观尽毁

广州TTG.XQ|又是一把膀胱局，TS前期太会“隐忍”了，XQ被让二追二！

即将|第七届“紫金奖·建筑及环境设计大赛”决赛即将启幕

北京日报客户端■金额共计4877亿元，在京保险公司向医护人员及家属赠送保险

深度放松身心，荣泰按摩椅带你体验豪华专业按摩体验

全球|全球数字经济超30万亿美元，德、英三产数字化渗透率最高

海报新闻客户端|青岛市城市管理局：政企交流探求科技赋能城市管理新方法

巧百搭|夏日如何搭配好看？温柔又休闲的18套穿搭，清凉解暑超美腻