大数据|何为大数据技术？大数据技术发展历程技术编程|大数据|

大数据发展到今天，通常来说有两层含义，海量的数据集合以及对海量数据集合进行处理的大数据技术。海量的数据集合，这个非常好理解，就是不断累积起来的数据资源，而大数据技术又是指什么呢？何为大数据技术，今天我们来对大数据技术发展历程做个简单的介绍。
【大数据|何为大数据技术？大数据技术发展历程】从定义来说，大数据技术是指从各种各样类型的巨量数据中，快速获得有价值信息的技术。在行业当中的大数据研发者们，就是致力于将大数据技术应用到相关领域，从巨量数据从中获取有价值的信息。

文章图片

文章图片

我们对大数据技术的认知，通常包括采集数据的工具、平台和数据分析系统等。
最早的第一代大数据技术框架，是Doug Cutting参考谷歌在2003年发表的Google File System论文，建立了Hadoop开源项目，并于2006年贡献给Apache基金会，用来构建大规模搜索引擎和解决大规模的数据存储和离线计算的难题。
首先诞生的是分布式文件系统HDFS和分布式计算框架MapReduce 。随后在2007年， Facebook开发了Hive ，可以使用类SQL语言查询存放在HDFS上的数据， PowerSet公司开发了分布式NoSQL数据库HBase 。
从2006到2009年这个阶段，以MapReduce计算框架为代表，大数据技术在大型互联网企业被广泛应用于大规模结构化数据的批处理，具体的应用场景是做日志分析和用户行为分析等。这个阶段我们称之为大数据的1.0时代。

文章图片

文章图片

大数据进入2.0时代的标志，是Spark核心计算引擎的出现。
由于MapReduce在要求短时间响应的交互式分析场景下表现不好，以Spark和Flink为代表的新计算引擎出现并广泛使用。这个阶段有三个重要变化：
一是大数据业务更多转为结构化数据处理等价值密度更高的计算，所有的大数据公司开始在Hadoop之上打造SQL引擎或分布数据库。2012年开始到随后两年中出现20多个基于Hadoop的SQL引擎，包括Impala、Spark SQL等，以及星环的Inceptor ，以解决结构化数据问题；
二是实时数据处理方面，大量的实时数据需要及时处理，到2015年， Flink、Beam、Spark Streaming等开源技术涌现，而商业化的流计算引擎如星环Slipstream的发展也如火如荼，相比开源的流引擎能够提供更多的产品能力，包括数据不丢不重、安全、SQL引擎等能力；
此外，非结构化的处理技术随着数据科学技术的发展而兴起，非结构化文档数据处理、图分析技术也逐渐兴起。
随着企业的数据量越来越大，数据业务的多样性和复杂性增加，在数据存储、计算和数据业务打通方面的挑战也越来越大。
关于何为大数据技术，大数据技术发展历程，以上就为大家做了一个简单的介绍了。大数据技术的发展，是随着大数据的发展在不断更新迭代的，作为技术开发者，保持学习，跟上最新技术趋势，是基本的素养。

大数据|何为大数据技术？大数据技术发展历程

推荐阅读

足球小子|枪手赛后还被嘲讽，阿森纳门将好憋屈！被故意撞伤只有1队友出头

央视网|美国民众质问：对于非洲裔美国人来说美国何时伟大过？

「高考」万千家长的血泪教训：孩子上高中，这五件事不能碰，家长要监督好

『大大说』不会说话的人！（写得真好），献给嘴笨

科技依依酱性能空前强大！AMD Ryzen 4000 APU曝光，8核16线程设计

趣头条|【帝豪GS】分享一下我的爱车帝豪GS

手机读卡器怎么使用

『咖喱饭』咖喱饭配什么菜好吃

小儿咳嗽常用食疗方推荐

笑笑哥|这个你们用还太早了，以后再说吧！，幽默笑话：小朋友

马石头@人力改变不了天意

郭某|95后小伙组织卖假鞋赚7千万被抓时订单每秒十几单

闲鱼有话说|50岁女人想甩掉“大妈感”，学西班牙王后这样穿裙子，优雅有气场

[吉利汽车]吉利缤瑞2020款亚运版怎么样？来自大鱼号|《尚车快报》

紫芝看世界为什么4G网速越来越慢了？手机店老板告诉你真正的原因

ps怎么去水印还原照片，ps处理水印的有效方法介绍

经济日报|养老的财该怎样理？

『cnBeta』哈勃带来耀眼粉色星云图像：被大质量新生恒星包围

土耳其人到底是不是突厥人,土耳其人属于白种人吗-

萝卜|萝卜丸子这样做，不用加水，外酥内软，解馋又不腻，比狮子头好吃