互联网|百度CTO王海峰揭秘NLP技术演进路径:要始终把握这两大趋势
【***智能综合报道】AI正在向更深层次进化 , 语言与知识技术的重要性愈加凸显 。 8月25日 , 以“掌握知识、理解语言、拥有智能”为主题的百度大脑语言与知识技术峰会重磅开启 , 百度CTO王海峰发表主旨演讲 , 解读百度语言与知识技术的发展历程与最新成果 ,
百度集团副总裁吴甜和百度技术委员会主席吴华分别发布百度语言与知识技术系列产品和数据集共建计划 , 重磅推出5款产品的新发布 , 全面加速AI技术大规模应用 。 在演讲中 , 王海峰表示 , “在百度语言与知识技术的布局和发展中 , 我们始终在注意把握两个趋势 , 即技术发展趋势和产业发展趋势 , 并力争引领趋势 。 ”
本文插图
语言与知识技术是人工智能认知能力的核心 , 以语言和知识为研究对象 , 让机器像人一样掌握知识、理解语言的自然语言处理技术 , 对于人工智能发展至关重要 。 十年来 , 百度大脑语言与知识技术成果丰硕 , 获得包括国家科技进步奖在内的20多个奖项 , 30多项国际竞赛冠军 , 发表学术论文超过300篇 , 申请专利2000多项 。 技术不断突破创新的同时 , 也在产品上创新探索 , 同时将领先的技术输出给开发者与合作伙伴 , 提升各行业智能化水平 。
百度引领语言与知识技术创新 , 形成完整技术布局
历经近十年发展 , 百度已经构建了完整的语言与知识技术布局 , 包括知识图谱、语言理解与生成技术 , 以及上述技术所支持的包含智能搜索、机器翻译、对话系统、智能写作、深度问答等在内的的应用系统 。
本文插图
其中 , 知识图谱是机器认知世界的基础 。 机器认知能力的突破 , 越来越依赖对知识和大规模知识图谱的运用 。 百度打造了世界上最大的多源异构知识图谱 , 拥有超过50亿实体和5500亿事实 , 并在不断演进和更新 , 已应用于各行各业 , 每日调用次数超过400亿次 。
【互联网|百度CTO王海峰揭秘NLP技术演进路径:要始终把握这两大趋势】
本文插图
不仅如此 , 针对不同应用场景和知识形态 , 百度还建立起多样化的知识图谱类型 , 既有基础的实体知识图谱 , 也有行业知识图谱、事件图谱、关注点图谱等 , 以及融合语音、视频、图片的多模态知识图谱 。 这背后 , 是百度创建的包括无标签大数据开放知识挖掘技术、知识体系自扩展的知识图谱自学习技术、以及融合多源异构数据的知识补全与整合技术在内一整套知识图谱构建方法 。
在知识的加持下 , 语言理解相关技术的能力不断增强 , 机器也可以逐渐像人一样不断学习、不断进步 。 百度提出知识增强的语义理解框架ERNIE , 在深度学习的基础上融入知识 , 具备人类一样的持续学习能力 , 曾一举登顶全球权威数据集GLUE榜单 , 首次突破90分大关 , 并且超越人类得分 。 而通过融入知识、语义理解、以及增强小样本学习能力 , 机器的阅读理解和对话能力也在迅速增强 。
本文插图
当然 , 和人类认知世界的形式类似 , 机器认知世界时 , 也不仅是运用自然语言 , 而往往是对语音、视觉、语音等多模态信息的综合应用 。
为此 , 百度研制了知识增强的跨模态深度语义理解方法 , 通过知识关联跨模态信息 , 运用语言描述不同模态信息的语义 , 进而让机器实现从“看清”到“看懂”、从“听清”到“听懂” , 即图像和语言、语音和语言的一体化理解 。 而融合场景图知识的跨模态语义理解预训练技术 , 则大幅提升了跨模态推理能力 。
推荐阅读
- Spacex|卫星互联网轨道资源稀缺,中国航天如何与国际卫星界大亨竞争?
- 互联网|建行“数字人民币钱包”已上线 仅限部分测试地区开通
- 行业互联网|大华股份与大连量天科技签署战略合作协议
- 行业互联网|原创 估值2000亿!刘强东手中这张“独角兽”,成立时间竟然不到两年?
- 行业互联网|李炳忠15点正式官宣,realme成立2年,稳居全球第七!
- 互联网|同城跑腿配送生意好做吗?需要注意什么?
- 互联网|招生部门公号也有高仿?!微信回应:已清除三千多个
- 互联网|马云最重要一次蜕变,高考失利后蹬三轮遇见他,改变了其一生轨迹
- 行业互联网|中兴通讯发布2020年半年度报告 营业收入达472亿元
- 互联网乱侃秀|5nm芯片,有EDA软件设计费4000万美元,没有EDA要77亿美元?