大数据开发职业发展路径( 三 ) 12年“入坑”

-storm
storm是一个实时计算框架，和hadoop的区别就是，hadoop是对离线的海量数据进行处理，而storm是对实时新增的每一条数据进行处理，是一条一条的处理，可以保证数据处理的时效性。学习storm主要学习topology的编写，storm并行度的调整，以及storm如何整合kafka实时消费数据。
-spark
spark 现在发展的也很不错，也发展成了一个生态圈，spark里面包含很多技术，spark core，spark steaming，spark mlib，spark graphx。
spark生态圈里面包含的有离线处理spark core，和实时处理spark streaming，在这里需要注意一下，storm和spark streaming ，两个都是实时处理框架，但是主要区别是：storm是真正的一条一条的处理，而spark streaming 是一批一批的处理。
spark中包含很多框架，在刚开始学习的时候主要学习spark core和spark streaming即可。这个一般搞大数据的都会用到。spark mlib和spark graphx 可以等后期工作需要或者有时间了在研究即可。
-elasticsearch
elasticsearch是一个适合海量数据实时查询的全文搜索引擎，支持分布式集群，其实底层是基于lucene的。在查询的时候支持快速模糊查询，求count，distinct，sum，avg等操作，但是不支持join操作。
elasticsearch目前也有一个生态圈，elk(elasticsearch logstash kibana)是一个典型的日志收集，存储，快速查询出图表的一整套解决方案。在学习elasticsearch的时候，前期主要学习如何使用es进行增删改查，es中的index，type，document的概念，以及es中的mapping的设计。
目前暂且列出来这么多吧，大数据生态圈目前还有很多比较好的技术框架，这个就需要等大家以后工作之后再去扩展了。
其实上面列出来的这十几个框架，在学习的时候，要专门挑一两个着重研究一下，最好针对，底层原理，优化，源码等部分有所涉猎，这么的话可以在面试过程中脱颖而出。不要想着把每一个框架都搞精通，目前是不现实的，其实就算是在工作中也不会每一个框架都会用的很深。
【大数据开发职业发展路径】 如果能过对上面的框架都大致会使用，并且对某一两个框架研究的比较深的话，其实想去找一份满意的大数据工作也就水到渠成了。

■网友
大数据职业的发展路径，这个还是要看个人能力，有能力的人可能不出一两年就可以很快的晋升，但是杜宇那些没有能力的人还是要从头坐骑的，可能他们干了很多年，却依然待在原地，这是对于他们的不公平，但是企业也不想，可是企业也是需要发展的，没有办法。

大数据开发职业发展路径( 三 )

推荐阅读

南京警方通报大学生“偷外卖”事件:有工作，偷外卖系报复行为

网络游戏|魔兽世界怀旧服NAXX成神的职业，暴雪设计师算是照顾了一回！

中新经纬|佐力药业：4名董监高拟减持不超2.03%股份

哈利波特|《霍格沃兹遗产》会登陆NS：但WB不愿透露发行形式

男孩叛逆期怎么沟通，男孩叛逆期怎么沟通呢

冻顶乌龙茶价格,冻顶乌龙茶因何久负盛名

老人|老人被狗绳绊倒身亡，给这些人敲响警钟！

「钱江晚报小时新闻」海警雷达搜索发现4艘船舶整队航行，他们为啥拒不停船？傍晚时分

欧洲硅谷在哪里听留学中介说爱尔兰现在计算机找工作不错，有了解欧洲计算机行业发展的人介绍一下吗

我想知道有没有人和我一样无聊，对啥都没有兴趣，啥也不想干，不知道活着的意义

虐心最帅|曾单挑吕布，战平马超，曹操手下第一猛将

评分|花120万购买一个账号，玩家还觉得很划算，这款网游人均土豪？

北京日报|北京最新天气预报：注意保暖！本市下午部分地区有零星小雨

『河青新闻网廊坊新闻』大城县中医医院·复工复产 |内科全力以赴

女屌丝怎样找男朋友

明星八卦|有一种差距叫00后男明星粉丝数，周震南最少，易烊千玺一骑绝尘

烹饪|茄子和它天生是一对，多做给家人吃，简单一煮，比吃肉还营养！

「奔驰C级」开奔驰C200L的都是什么阶层的人？月薪6000能不能养得起？

孟晚舟@?重现“孟晚舟事件”？美国突然公布，谁也没想到，一切来得如此快

王者联盟|王者荣耀：新版本大洗牌，中路法王或将重新崛起