大数据交易模式未来会是咋样的( 二 )
大数据应用成本高的原因是某个组织机构要想挖掘应用大数据,需要经过数据采集、数据清洗、数据挖掘系统开发、信息/知识应用一系列步骤,每个步骤均需花费大量的人力物力。大数据应用收益低的原因是大数据具有价值密度低的特点,单个机构具有的数据量小又单一,能够挖掘到的信息/知识少,准确率低,能够产生的价值也低。这就是很多中小企业虽然认识到了大数据应用的价值,却迟迟没有行动的原因。
3大数据应用的特点
3.1 特点一:大数据应用具有规模效应
大数据应用具有的规模效应主要表现在三个方面:
(1)数据量越大、越多样,能够挖掘分析出的信息/知识就越多,价值也就越大。例如
一家工厂的数据资源分析不出整个制造业的形势,而全国工厂的数据资源整合之后就能分析
出整个制造业的形势。清楚了整个制造业的形势,政府就能制定出有针对性的政策指导制造
业的发展,工厂也能够有计划地生产。
(2)数据量越大、越多样,挖掘分析出的结果相对来说就越准确。大数据应用相较于
传统统计的优势就在于数据量大、种类多,通过对全量数据的分析提高结果的准确度。
(3)一套数据挖掘系统应用的人数越多、次数越多,单人单次利用的成本越低。数据
挖掘系统具有软件开发的一般特点,即成本主要集中在研发阶段,软件开发完成之后使用的
人越多,每人单次分摊的成本越低。
3.2 特点二:同一信息/知识可以从不同的数据资源挖掘出
从不同类型的数据资源中可以挖掘出相同的信息,例如可以从一个家庭的用电量和用电
方式挖掘出这个家庭的财富状况,也可以从这个家庭的出行地理位置挖掘出这个家庭的财富
状况。
3.3 特点三:数据挖掘利用的是数据资源的使用权不是所有权
对于数据挖掘者来说,只要拥有了数据资源的使用权,就可以进行数据挖掘,是否还拥
有数据资源的所有权就无关紧要了。
3.4 特点四:人们利用的是数据挖掘出的信息/知识而不是原始数据
人们在做决策时,不是直接利用数据,而是利用由数据资源形成的信息/知识。人们的
决策过程可以分为两步:第一步分析数据资源形成一个简单的报告;第二步根据报告进行决
策。当数据量很小时,这两步在大脑中一次完成;但当数据量很大时,就必须分为清晰的两
步。例如,银行的工作人员要想根据用户的工作情况、日常消费情况、以往的存贷款情况等
等数据来判断用户的还款能力,就必须先根据这些数据形成一个正式报告,再根据报告进行
决策。数据量越大,当用户利用数据做决策时,越需要先形成报告,并且在数据挖掘分析形
成报告方面,计算机较人越有优势。
3.5 特点五:数据挖掘出的信息/知识对原始数据具有一定的屏蔽效应
数据挖掘出的信息/知识对原始数据具有一定的屏蔽效应。例如,阿里芝麻信用的评分
把用户的具体购物信息和购物习惯进行了屏蔽,人们是无法根据芝麻信用的评分了解到用户
哪天购买了什么,以及用户的具体购物习惯的。通常数据量越大,数据挖掘出的信息/知识
4基于云服务的大数据交易平台模式
4.1 平台的总体设计思路
基于云服务的大数据交易平台(以下简称平台)模式有两大要点。一、为了实现数据集中、减小数据泄露的风险,要最少化数据资源的存储机构,最小化数据资源的传输路径。要实现这一要点,需要将数据资源直接从数据产生机构传输到平台的数据中心,并一直停留在平台的数据中心,不再传输给其他任何机构,只将挖掘出的信息/知识传输给应用机构。因此,平台不仅要提供存储资源,而且要提供计算资源,即平台方要提供包括存储资源和计算资源的云服务。二、为了提高大数据应用的效率和效益,要建立大数据应用产业链。也就是要基于大数据交易平台提供的云服务,围绕大数据交易平台建立一个包含数据的产生环节、数据的预处理整合环节、数据资源的挖掘环节和数据挖掘出的信息/知识的应用环节的产业链。
推荐阅读
- “一部手机读云南”上线力争建成国家方志大数据中心西南中心
- 市行政■盐城不动产交易一体化平台跑出全省最快加速度
- 安徽合肥:辅警管理新模式电诈压降显成效
- 联合国大数据全球平台中国区域中心在杭州成立
- 甘肃乡贤文化渐兴:兰州高新区探“村委+乡贤”模式
- 银行的数据中心可以跳槽去互联网公司吗
- 互联网在线音乐行业有哪些可能的盈利模式
- |大数据赋力 半个多月前拉客的“黑车”精准落网
- 数据采集终端|
- 关于用phpfsocket 写Post, 模拟http 报文怎样写入要传输的处理数据
