什么是时序数据?如何治理?有哪些应用场景?终于有人讲明白了

前言时序数据治理是数据治理领域核心、打通IT与OT域数据链路 , 是工业物联网基石、大数据价值创造的关键、企业管理提升的发动机、是数字化转型的重要支撑 。
工业企业在生产经营过程中 , 会运用物联网技术 , 采集大量的数据并进行实时处理 , 这些数据都是时序的 , 而且具有显著的特点 , 比如带有时间戳、结构化、没有更新、数据源唯一等 。
时序数据处理应用于智慧城市、物联网、车联网、工业互联网领域的过程数据采集、过程控制 , 并与过程管理建立一个数据链路 , 属于工业数据治理的新兴领域 。
本文主要讲解时序数据的定义、典型特点、时序数据的应用场景、数采难点及时序数据工具等内容 。
一时序数据的定义及作用时序数据是指时间序列数据 。是按时间顺序记录的数据列 , 在同一数据列中的各个数据必须是同口径的 , 要求具有可比性 。时序数据可以是时期数 , 也可以时点数 。
时序数据管理主要通过对时序数据的采集、处理和分析帮助企业实时监控企业的生产与经营过程 。
时序数据在应用上特点也很明显 , 比如数据往往只保留一定时长 , 需要做降频采样、插值、实时计算、聚合等操作 , 关心的是一段时间的趋势 , 而不是某一特定时间的值等 。
工业企业为了监测设备、生产线以及整个系统的运行状态 , 在各个关键点都配有传感器、采集各种数据 。这些数据是周期或准周期产生的 , 有的采集频率高 , 有的采集频率低 , 这些采集的数据一般会发送至服务器 , 进行汇总并实时处理 , 对系统的运行做出实时监测或预警 。
时序数据常常被长期保存下来 , 用以做离线数据分析 , 例如在工业企业应用场景如下:
1)分析故障 , 看主要的设备故障是什么;
2)分析产能 , 看如何优化配置来提升生产效率;
3)分析能耗 , 看如何降低生产成本;
4)分析潜在的安全隐患 , 以降低故障时长 。

什么是时序数据?如何治理?有哪些应用场景?终于有人讲明白了

文章插图
 
《数据治理:工业企业数字化转型之道》数据治理体系车轮图
二时序数据的十二大典型特点与各种信息管理系统的数据相比 , 工业领域的时序数据具有鲜明的特点 。
什么是时序数据?如何治理?有哪些应用场景?终于有人讲明白了

文章插图
 
(1)数据是时序的 , 一定带有时间戳:联网的设备按照设定的周期 , 或受外部事件的触发 , 源源不断地产生数据 , 每个数据点是在哪个时间点产生的 , 这个时间对于数据的计算和分析十分重要 , 必须要记录 。
(2)数据是结构化的:网络爬虫的数据、微博、微信的海量数据都是非结构化的 , 可以是文字、图片、视频等 。但物联网设备产生的数据往往是结构化的 , 而且是数值型的 , 比如智能电表采集的电流、电压就可以用4字节的标准的浮点数来表示 。
(3)数据极少有更新操作:联网设备产生的数据是机器日志数据 , 一般不容许而且也没有修改的必要 。很少有场景 , 需要对采集的原始数据进行修改 。但对于一个典型的信息化或互联网应用 , 记录是一定可以修改或删除的 。
(4)数据源是唯一的:一个物联网设备采集的数据与另外一个设备采集的数据是完全独立的 。一台设备的数据一定是这台设备产生的 , 不可能是人工或其他设备产生的 , 也就是说一台设备的数据只有一个生产者 , 数据源是唯一的 。
(5)相对互联网应用 , 写多读少:对于互联网应用 , 一条数据记录 , 往往是一次写 , 很多次读 。比如一条微博或一篇微信公众号文章 , 一次写 , 但有可能会有上百万人读 。但物联网设备产生的数据不一样 , 对于产生的数据 , 一般是计算、分析程序自动读 , 而且计算、分析次数不多 , 只有分析事故等场景 , 人才会主动看原始数据 。
(6)用户关注的是一段时间的趋势:对于一条银行记录 , 或者一条微博、微信 , 对于它的用户而言 , 每一条都很重要 。但对于物联网数据 , 每个数据点与数据点的变化并不大 , 一般是渐变的 , 大家关心的更多是一段时间 , 比如过去5分钟 , 过去1小时数据变化的趋势 , 一般对某一特定时间点的数据值并不关注 。


推荐阅读