宝石流云|终于有人把AI、BI、大数据、数据科学讲明白了( 四 )


还有一些人 , 甚至试图通过讨论数据科学家的工作来定义数据科学:数据科学家所需要的技能 , 他们所扮演的角色 , 他们所使用的工具和技术 , 他们工作的地方 , 以及他们的教育背景 , 等等 。 但这些并没有对数据科学给出一个有意义的定义 。
与其按照人(数据科学家)或他们所处理的问题来定义数据科学 , 不如将其定义如下:
数据科学是一门科学学科 , 它利用统计和数学等领域的定量方法以及现代技术 , 开发出用于发现模式、预测结果和为复杂问题找到最佳解决方案的算法 。
数据科学和分析的区别在于 , 数据科学可以帮助甚至支持自动化实现对数据的分析 , 但是分析是一种以人为中心的策略 , 它充分利用各种工具 , 包括那些在数据科学中发现的工具 , 来理解事物现象之间的真正本质 。
数据科学可能是这些概念中涉及面最广泛的 , 因为它关系到处理“数据”的整个科学和实践 。 我认为数据科学是由计算机科学家设计的分析学 , 但在实践中 , 数据科学往往侧重于对一般性宏观问题的研究 , 而分析往往侧重于解决特定行业或具体问题的挑战 。
宝石流云|终于有人把AI、BI、大数据、数据科学讲明白了06 边缘(和环境)分析在很多现代企业 , 分析是它们的一种核心业务活动 , 这些企业通过数据驱动和以人为中心的业务运营与管理流程实现了数据的大众化(democratize data) 。
而边缘分析(edge analytics)一般指的是分布式分析 , 在这种场景下 , 分析被内置到一些机器或系统中 , 通过这种内置的方式 , 信息的生成与收集已经成为企业“下意识”的自主活动 。
边缘分析通常与智能设备相关 , 这种情况下 , 分析计算是在数据收集点(例如设备、传感器、网络交换机或其他设备)开展的 , 与传统的数据管道传输方式(即采集数据、传输数据、清洗数据、集成数据、存储数据)不同 , 边缘分析把分析嵌入到收集数据的设备中完成或就近实现 。

  • 数据大众化
所谓数据大众化 , 指的是数据开放 , 使每个能够而且应该能够获得数据的人都有权通过工具来探索获取这些数据 , 而不是将数据局限于少数特权群体 。
例如 , 传统的信用卡欺诈检测依赖于机器(例如读卡器) , 并通过与授权“代理”的连接发送请求来验证一个交易 , 算法需要在极短的时间内(百分之一毫秒)对此交易完成授权或打上欺诈标签 , 最后 , 读卡设备接收授权指令后完成或拒绝交易操作 。 在边缘分析中 , 算法将运行在仪器本身上(比如带有嵌入式分析的智能芯片读卡器) 。
边缘分析通常与物联网(IoT)联系在一起 。 最近IDC在针对物联网IoT未来视界(FutureScape)的一份报告中提出 , 到2018年 , 40%的物联网数据将在网络中产生数据的边缘完成数据的存储、处理、分析和响应 。
随着物联网的发展 , 我们很可能会看到未来对所谓的“万物分析”(Analytics of Things , AoT)有更多的关注 , 它指的是分析将给物联网数据带来独特价值的机会 。
环境分析(ambient analytics)是另一个相关的术语 , 它的名字意味着“分析无处不在” 。 就像房间的灯光或音响常常不被注意 , 但却为舞台构建了氛围一样 , 环境分析也会影响我们工作和娱乐的环境 。
我们看到环境智能正在日常生活场景中发挥作用 , 比如检测血糖水平和注射胰岛素 。 同样 , 当你回到住家附近时 , 家居自动化设备检测到相应信息 , 会自动调整温度和打开照明 。 环境分析超越了基于简单规则的决策 , 它利用算法来决定合适的行动路线 。
毫无疑问 , 边缘和环境分析将继续挑战传统的以人为中心的管理方式与流程 , 传统管理方式下 , 使用分析结果(如对分析的理解、决策和采取的行动)以人为主 , 而在边缘和环境分析中会有越来越多的(不需要人工介入的)自主决策与执行 。


推荐阅读