LTP 4.0!单模型完成6项自然语言处理任务
文章插图
语言技术平台(Language Technology Platform,LTP)是哈工大社会计算与信息检索研究中心(HIT-SCIR)历时多年研发的一整套高效、高精度的中文自然语言处理开源基础技术平台 。该平台集词法分析(分词、词性标注、命名实体识别)、句法分析(依存句法分析)和语义分析(语义角色标注、语义依存分析)等多项自然语言处理技术于一体 。
其中句法分析、语义分析等多项关键技术多次在CoNLL国际评测中获得了第1名 。此外,平台还荣获了2010年中国中文信息学会科学技术一等奖、2016年黑龙江省科技进步一等奖 。国内外众多研究单位和知名企业通过签署协议以及收费授权的方式使用该平台 。
哈工大SCIR本科生冯云龙等同学在车万翔教授指导下,于近日对LTP进行了新一轮的全面升级,并推出了LTP 4.0版本 。此次升级的主要改进为:
- 基于多任务学习框架进行统一学习,使得全部六项任务可以共享语义信息,达到了知识迁移的效果 。既有效提升了系统的运行效率,又极大缩小了模型的占用空间
- 基于预训练模型进行统一的表示 ,有效提升了各项任务的准确率
- 基于教师退火模型蒸馏出单一的多任务模型,进一步提高了系统的准确率
- 基于PyTorch框架开发,提供了原生的Python调用接口,通过pip包管理系统一键安装,极大提高了系统的易用性
文章插图
【LTP 4.0!单模型完成6项自然语言处理任务】为了模型的小巧易用,本次发布的版本基于哈工大讯飞联合实验室发布的中文ELECTRA Small预训练模型 。后续将陆续发布基于不同预训练模型的版本,从而为用户提供更多准确率和效率平衡点的选择 。测试环境如下:
- Python 3.7
- LTP 4.0 Batch Size = 1
- centos 3.10.0-1062.9.1.el7.x86_64
- Intel(R) Xeon(R) CPU E5-2640 v4 @ 2.40GHz
推荐阅读
- vivo|国产最强!曝vivo将首发2K/120Hz LTPO 3.0屏幕:支持原生10Bit色彩
- LTPO|国产屏重大突破!华星光电发布自研2K LTPO柔性屏:流畅、省电
- LTPO|对标三星!华星光电LTPO 2K屏幕来袭:不伤眼
- 一文看懂华为 HMS Core 4.0 内容大全
- 传统,转子,CTC,LTP四种红碎茶制作解析 看下你更喜欢哪种
- 固态硬盘|江波龙PCIe 4.0 x4 SSD首发:无缓存飙上7GB/s
- 荣耀|全球首款LTPO+高频PWM调光!荣耀Magic4开售:3999元起
- 微星|实惠好用的入门级PCIe 4.0 SSD来了!微星SPATIUM M450上手
- 任天堂|5年来最大升级!Switch发布14.0.0更新:游戏分组终于来了
- 京东方|1Hz-120Hz自适应切换!京东方宣布f-OLED LTPO变频显示屏量产