|谷歌新模型突破BERT局限:NLP版「芝麻街」新成员Big Bird长这样( 二 )
本文插图
与此同时 , Big Bird在NLP的摘要任务中表现也比较亮眼 。
摘要 , 顾名思义是从一段长文字中提炼出这段话的核心思想和意义 。 下面是从三个长文章数据集Arxiv、PubMed和BigPatent中测试的效果 。
本文插图
从图中来看 , 与其他非常先进的NLP模型相比 , BigBird极大地提高了摘要任务的各项精度 , 性能表现非常优异 。
不仅如此 , Big Bird被证明是图灵完备的 , 这也就意味着 , 一切可以计算的问题 , Big Bird都能计算 , 理论上 , 它能够用来解决任何算法 。
此外 , Big Bird在基因组数据处理方面也极具潜力 。
但虽然如此 , 也有网友认为 , 这样的模型与Longformer在概念上并无本质区别 , 不能算是一个大突破 。
本文插图
你怎么看?
作者介绍
论文的两位共同一作是Manzil Zaheer和Guru Guruganesh , 均来自谷歌 。
本文插图
△ Manzil Zaheer
Manzil Zaheer , CMU机器学习博士 , 3篇论文曾经发表于NIPs上 , 除此之外 , 在ACL和EMNLP等顶会上也发表过相应文章 。
本文插图
△ Guru Guruganesh
Guru Guruganesh , CMU机器学习博士 , 主要在近似算法、拉姆齐定理、半正定规划等方向有所研究 。
传送门
「芝麻街」系列论文列表:
ELMo:https://arxiv.org/abs/1802.05365
BERT:https://arxiv.org/abs/1810.04805
ERNIE:https://arxiv.org/abs/1904.09223
Grover:https://arxiv.org/abs/1905.12616
KERMIT:https://arxiv.org/abs/1906.01604
Big Bird:https://arxiv.org/abs/2007.14062
— 完 —
量子位 QbitAI · ***签约
关注我们 , 第一时间获知前沿科技动态
推荐阅读
- |将量子计算机当作神经网络,首次模拟化学反应,谷歌新研究登上Science封面
- 中年|几千块的乐高不香了?国产全金属机械模型,上百个零件,才68元
- KL|耐能发布全新AI芯片KL720 能效超过谷歌和英特尔
- 科学|科学家预言,在超新星中微子中,将首次观测超出标准模型粒子
- 科学|谷歌量子计算登《科学》封面 量子模拟了化学反应
- 宣传|透过口号看真相:谷歌、苹果、麦当劳和 Zoom 真正的宗旨是什么?
- 网站|青岛网络营销的5种常见模型
- 谷歌|5G加速云游戏落地 手机体验3A大作将成现实
- 互联网|如何解构一款成熟复杂产品,搭建典型用户成长模型
- 青年|打破后浪推前浪的魔咒,苹果 谷歌 iRobot们的秘密