全球首部多语种《数典》首发


5月18日 , 全球首部全面系统研究大数据标准术语的多语种专业工具书《数典》在北京、贵阳网络首发 。 5月19日 , 都市新闻采访人员了解到 , 目前数典工程已收录“大数据+行业应用”相关术语词条约2万条 , 通用领域数据描述模型约200个 , 以及公安、检务等行业领域描述模型50余个 。
全球首部多语种《数典》首发
本文插图

据了解 , 《数典》由贵阳市人民政府、科学出版社主办 , 大数据战略重点实验室等承办 , 是数典工程中的重要一块内容 , 对提升中国大数据的国际话语权和规则制定权 , 加快大数据知识国际传播和普及应用具有现实而深远的意义 , 标志着数典工程建设迈向深入 。
5月19日 , 采访人员走进位于贵阳高新区的中电科大数据研究院有限公司(以下简称“大数据院”)了解到 , 目前数典工程已收录“大数据+行业应用”相关术语词条约2万条 , 通用领域数据描述模型约200个 , 以及公安、检务等行业领域描述模型50余个 。
而此次出版的《数典》共收录5692条大数据标准术语 , 以全球语境和未来视角 , 对大数据知识体系进行了全面梳理 , 提出了涵盖大数据基础、大数据战略、大数据技术、大数据经济、大数据金融、大数据治理、大数据标准、大数据安全和大数据法律在内的九个方面的术语架构 , 并聚焦SCI、SSCI、EI、ISTP四大权威文献库进行高频词研究 , 其中 , 块数据、数权法、主权区块链等具有中国原创特色的新词占十分之一以上 。
随着数字经济浪潮席卷全球 , 大数据产业“炙手可热” 。 在大数据产业蓬勃发展的同时 , 伴随着数据释义与内容格式不规范、数据标准难统一等问题 , 严重制约了大数据资源整合和规范发展 。
2019年 , “数典”这一概念首次在数博会上被提出 , 同年5月 , 大数据院启动了“数典”策划论证工作 , 针对数据释义与内容格式不规范、数据标准难统一等问题 , 提出了打造中国最大规模的数据基础资源集智平台——数典工程 , 秉承“工具化、平台化、开放化”的建设理念 , 构建以数典理论为基石、以大数据词典为核心、以数典平台为载体 , 以标准规范为保障并拓展多项数据服务的“3+3+N”体系架构 。
【全球首部多语种《数典》首发】
全球首部多语种《数典》首发
本文插图

“数典工程可以有效解决数据规范定义、统一标识、系统分类以及数据融合应用等带来的困难 , 避免造成数据‘难用、滥用、混用’等现象 。 ”大数据院刘汪洋博士介绍到 , 打造数典是一项承前启后的基础性工程 , 对巩固大数据成果、引导大数据规范发展具有重要的意义 。
目前 , 大数据院正积极梳理构建“互联网+政务服务”领域数据描述模型 。 为了更好地开展数据描述模型构建和管理 , 大数据院已完成数据模型管理及可视化工具研制 , 有力地支撑大规模数据模型储存于管理 。
下一步 , 大数据院将持续推进“数典工程”理论研究和相关工具的研制工作 。 并计划与社会各界一起打造“数典”开源社区 , 提供在线权威性解释、专业化推荐、用户在线交流等服务 , 提高政府、企业、社会组织、个人等各方在大数据领域的用词规范性和共识度 , 并以“众包”模式持续推进数典的更新维护和优化完善 , 最终实现社会资源集智和知识赋能 , 助力升华贵阳大数据建设成就 , 引领大数据发展再上新高度 。
杨婷 都市新闻采访人员 刘昌敏
编辑 罗镇武
校对 黄盈莹
编审 廖波


    推荐阅读