大数据是做什么的(大数的信息有什么)

大数据是指传统数据处理应用软件无法处理的大型或复杂数据集的术语 。它存储来自各种来源的大量非结构化或结构化数据 。大数据通常包含其大小超过传统软件在可接受的时间内处理能力的数据 。
大数据其实是一头大象 。每个人对大数据的认知都不一样,就像瞎子摸象 。有人说大象像一根巨大的柱子,有人说大象像水管,还有人说大象像一把扇子,摸的部位不同,感觉也不一样 。

研究机构Gartner将“大数据”定义为海量、高增长、多元化的信息资产,需要新的处理模式,以具备更强的决策、洞察和流程优化能力 。
麦肯锡(美国领先的咨询公司,大数据研究的先驱)在其报告《大数据:创新、竞争和生产力的下一个前沿》中给出的大数据定义是,大数据是指规模超过常规数据库工具的获取、存储、管理和分析能力的数据集 。
亚马逊(全球最大的电子商务公司)的大数据科学家约翰·劳瑟(John Rauser)给出了一个简单的定义:大数据是超过计算机处理能力的任何数量的数据 。
大数据的四个特征:
1) Volume的海量数据规模:数据量已经从TB跃升到PB,2020年全球数据量将达到35ZB,到2035年这个数字将达到2142ZB 。
2) Variety的多样化数据类型:结构化、半结构化和非结构化数据,以不同的形式存储(文本、图像、视频、机器数据等 。)
3) Velocity实时数据循环和动态数据系统:大数据是一个庞大的、持续的数据流,可以帮助研究人员进行实时分析和跟踪,取得立竿见影的效果 。
【大数据是做什么的(大数的信息有什么)】4)看重巨大的数据价值:大数据的价值密度低,保留了大量的人的行为数据 。通过有效的数据挖掘和分析,可以发现隐藏在大量细节背后的规律,并根据规律预测未来 。


    推荐阅读