大数据开发职业发展路径( 二 ) 12年“入坑”

下面我就大致列一下，各种框架的一个学习步骤吧：
注意：下面列出来的顺序只是个人建议，可以根据个人实际情况来调整顺序
linux基础和javase基础【包含mysql】
这些是基本功，刚开始也不可能学的很精通，最起码要对linux中的一些基本的命令混个脸熟，后面学习各种框架的时候都会用到，用多了就熟悉了。javase的话建议主要看面向对象，集合，io，多线程，以及jdbc操作即可。
zookeeper
zookeeper是很多大数据框架的基础，中文名称是动物园的意思，因为目前的大数据框架的图标很多都是动物的形状，所以zookeeper其实就是可以管理很多大数据框架的。针对这个框架，主要掌握如何搭建单节点和集群，以及掌握如何在zkcli客户端下对zookeeper的节点进行增删改查操作即可。
hadoop
目前企业中一般都是用hadoop2.x的版本了，所以就没有必要再去学hadoop1.x版本了，hadoop2.x主要包含三大块
hdfs 前期，主要学习hdfs的一些命令即可，上传，下载，删除，移动，查看等命令…
mapreduce 这个需要重点学习下，要理解mr的原理以及代码实现，虽然现在工作中真正写mr的代码次数很少了，但是原理还是要理解的。
yarn 前期了解即可，只需要知道yarn是一个资源调度平台，主要负责给任务分配资源即可，yarn不仅可以给mapreduce任务调度资源，还可以为spark任务调度资源…yarn是一个公共的资源调度平台，所有满足条件的框架都可以使用yarn来进行资源调度。
hive
hive是一个数据仓库，所有的数据都是存储在hdfs上的，具体【数据仓库和数据库】的区别大家可以去网上搜索一下，有很多介绍。其实如果对mysql的使用比较熟悉的话，使用hive也就简单很多了，使用hive主要是写hql，hql是hive的sql语言，非常类似于mysql数据库的sql，后续学习hive的时候主要理解一些hive的语法特性即可。其实hive在执行hql，底层在执行的时候还是执行的mapredce程序。
注意：其实hive本身是很强大的，数据仓库的设计在工作中也是很重要的，但是前期学习的时候，主要先学会如何使用就好了。后期可以好好研究一下hive。
hbase
hbase是一个nosql 数据库，是一个key-value类型的数据库，底层的数据存储在hdfs上。在学习hbase的时候主要掌握 row-key的设计，以及列簇的设计。要注意一个特点就是，hbase基于rowkey查询效率很快，可以达到秒级查询，但是基于列簇中的列进行查询，特别是组合查询的时候，如果数据量很大的话，查询性能会很差。
redis
redis也是一个nosql 数据库和key-value类型的数据库，但是这个数据库是纯基于内存的，也就是redis数据库中的数据都是存储在内存中的，所以它的一个特点就是适用于快速读写的应用场景，读写可以达到10W次/秒，但是不适合存储海量数据，毕竟机器的内存是有限的；
当然，redis也支持集群，也可以存储大量数据。在学习redis的时候主要掌握string，list，set，sortedset，hashmap这几种数据类型的区别以及使用，还有pipeline管道，这个在批量入库数据的时候是非常有用的，以及transaction事务功能。
-flume
flume是一个日志采集工具，这个还是比较常用的，最常见的就是采集应用产生的日志文件中的数据。一般有两个流程，一个是flume采集数据存储到kafka中，为了后面使用storm或者sparkstreaming进行实时处理。另一个流程是flume采集的数据落盘到hdfs上，为了后期使用hadoop或者spark进行离线处理。在学习flume的时候其实主要就是学会看flume官网的文档，学习各种组建的配置参数，因为使用flume就是写各种的配置。
-kafka
kafka 是一个消息队列，在工作中常用于实时处理的场景中，作为一个中间缓冲层，例如，flume-\u0026gt;kafka-\u0026gt;storm/sparkstreaming。学习kafka主要掌握topic，partition，replicate等的概念和原理。

大数据开发职业发展路径( 二 )

推荐阅读

【新春走基层】“放下羊鞭”建景区——甘肃尕秀村牧民定居点走访

第一军武@美航母舰长为拯救数千人发声，却被无情革职，五角大楼令人心寒

双眼皮男生|本来想走楼梯的, 可走到电梯旁却听到...，开心一刻：去医院挂号,

AMD|反向开车市场统计显卡价格开始回涨

违停通道还不留电话，等1天后再来开车，女车主，临时停放

#阿里巴巴#美国要对马云动手了！

怎么样炖鸡汤，怎么炖鸡才好吃

羊仔的职场之路：真相很现实，职场上长得漂亮的人更受青睐？领导告诉你实情

含量|黄的、白的、花的哪种好？老农：3种差别大，买错不好吃买玉米

看图识物 n.05丨APS-C 画幅性能旗舰，FUJIFILM X-T4

蚧壳虫用什么农药可以杀死蚧壳虫用什么农药最好

文艺又好听的除夕跨年文案 2021除夕跨年文案

穿搭|秋天来了你准备好了吗

世界上最深的的十大湖泊是哪些世界上最深的湖

『迷彩虎军事』遭猛烈反击后立马改口，这是宣战！特朗普将目光瞄向我们

#此刻#此刻的福州！战“疫”的第一道关口

阿萨姆红茶的概念,阿萨姆红茶糖

『松果』春天在公园捡的“松果”，拿回家简单1处理，变成养花“好肥料”

运动达人|东京奥运参赛人选仍存无限可能，郎平透露中国女排二期集训信息

窦维德▲中国股市：读股票书籍百遍不如细读此文一遍！