什么是大数据?有什么意义 大数据的意义和用途


什么是大数据?有什么意义 大数据的意义和用途

文章插图
本篇文章给大家谈谈大数据的意义,以及大数据的意义和用途对应的知识点,希望对各位有所帮助,不要忘了收藏本站!
内容导航:
  • 什么是大数据?有什么意义?
  • 大数据存在的意义和用途是什么?
  • 大数据存在的意义和用途是什么
  • 大数据存在的意义和用途是什么?
  • 大数据有哪些意义?
  • 大数据的意义
Q1:什么是大数据?有什么意义?"大数据"是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理 。"大数据"首先是指数据体量(volumes)?大,指代大型数据集,一般在10TB?规模左右,但在实际应用中,很多企业用户把多个数据集放在一起,已经形成了PB级的数据量;其次是指数据类别(variety)大,数据来自多种数据源,数据种类和格式日渐丰富,已冲破了以前所限定的结构化数据范畴,囊括了半结构化和非结构化数据 。接着是数据处理速度(Velocity)快,在数据量非常庞大的情况下,也能够做到数据的实时处理 。最后一个特点是指数据真实性(Veracity)高,随着社交数据、企业内容、交易与应用数据等新数据源的兴趣,传统数据源的局限被打破,企业愈发需要有效的信息之力以确保其真实性及安全性 。
数据采集:ETL工具负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础 。
数据存取:关系数据库、NOSQL、SQL等 。
基础架构:云存储、分布式文件存储等 。
数据处理:自然语言处理(NLP,NaturalLanguageProcessing)是研究人与计算机交互的语言问题的一门学科 。处理自然语言的关键是要让计算机"理解"自然语言,所以自然语言处理又叫做自然语言理解(NLU,NaturalLanguage Understanding),也称为计算语言学(Computational Linguistics 。一方面它是语言信息处理的一个分支,另一方面它是人工智能(AI, Artificial Intelligence)的核心课题之一 。
统计分析:假设检验、显著性检验、差异分析、相关分析、T检验、方差分析、卡方分析、偏相关分析、距离分析、回归分析、简单回归分析、多元回归分析、逐步回归、回归预测与残差分析、岭回归、logistic回归分析、曲线估计、因子分析、聚类分析、主成分分析、因子分析、快速聚类法与聚类法、判别分析、对应分析、多元对应分析(最优尺度分析)、bootstrap技术等等 。
数据挖掘:分类 (Classification)、估计(Estimation)、预测(Prediction)、相关性分组或关联规则(Affinity grouping or association rules)、聚类(Clustering)、描述和可视化、Description and Visualization)、复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)
模型预测:预测模型、机器学习、建模仿真 。
结果呈现:云计算、标签云、关系图等 。
要理解大数据这一概念,首先要从"大"入手,"大"是指数据规模,大数据一般指在10TB(1TB=1024GB)规模以上的数据量 。大数据同过去的海量数据有所区别,其基本特征可以用4个V来总结(Vol-ume、Variety、Value和Veloc-ity),即体量大、多样性、价值密度低、速度快 。
第一,数据体量巨大 。从TB级别,跃升到PB级别 。
第二,数据类型繁多,如前文提到的网络日志、视频、图片、地理位置信息,等等 。
第三,价值密度低 。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒 。
第四,处理速度快 。1秒定律 。最后这一点也是和传统的数据挖掘技术有着本质的不同 。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式 。
大数据技术是指从各种各样类型的巨量数据中,快速获得有价值信息的技术 。解决大数据问题的核心是大数据技术 。目前所说的"大数据"不仅指数据本身的规模,也包括采集数据的工具、平台和数据分析系统 。大数据研发目的是发展大数据技术并将其应用到相关领域,通过解决巨量数据处理问题促进其突破性发展 。因此,大数据时代带来的挑战不仅体现在如何处理巨量 收起
Q2:大数据存在的意义和用途是什么?1.将大数据分析纳入流程的做法揭示了非结构化数据,从而有助于管理者以系统的方式分析其决策,并在需要时采取替代方法 。


推荐阅读