Hadoop|带你对比Hadoop MapReduce与Apache Spark( 三 )
Apache Spark以微批的方式执行作业 , 这些作业非常短 , 例如大约不到5秒 。 与面向实时流的Hadoop框架相比 , Apache Spark过去一直在提供更高的稳定性方面取得了成功 。
尽管如此 , 每个硬币都有两个面 , 是的 , Hadoop Spark也存在一些积压 , 例如如果中间数据大于节点的内存大小 , 则无法处理 , 节点故障时的问题 , 最重要的是成本因素 。
Hadoop Spark利用日志记录(也称为“重新计算”)来提供弹性 , 以防万一发生节点故障 , 因此我们可以得出结论 , 节点故障情况下的恢复行为与以下情况相似: Hadoop MapReduce除外 , 事实上恢复过程会更快 。
如果特定节点的RAM不足以存储数据分区 , Spark还具有“溢出磁盘”功能 , 从而为基于磁盘的数据处理提供了适度的降级功能 。
Hadoop MapReduce相对于Apache Spark的一大优势 是 , 如果数据大小大于内存 , 则在这种情况下 , Apache Spark将无法利用其缓存 , 并且很有可能比它慢得多 。MapReduce的批处理 。
困惑的Hadoop与Spark –选择哪一个?
如果让您对Hadoop MapReduce或Apache Spark 感到困惑的问题 ,或者说是选择基于磁盘的计算或基于RAM的计算 , 那么这个问题的答案很简单 。 这全都取决于并且这个决定所依赖的变量会随着时间而动态变化 。
【Hadoop|带你对比Hadoop MapReduce与Apache Spark】但是 , 当前的趋势支持诸如Apache Spark之类的内存技术 , 因为行业趋势似乎正在为其提供积极的反馈 。 因此 , 总而言之 , 我们可以说 , 选择Hadoop MapReduce与Apache Spark取决于基于用户的情况 , 我们无法做出自主选择 。
推荐阅读
- OPPO手机|屏幕素质好是什么体验?三款旗舰机型对比有答案,网友都Pick它
- 荣耀手机,5G手机|荣耀X10 Max对比红米K30 5G:游戏体验谁更香?
- 中年|一篇文章带你搞懂网络爬虫过程中伪装浏览器的请求头常见字段
- 英特尔,AMD|116项对比测试:Intel免费提速6% 一对比尴尬了
- pro|华为P40 Pro和vivo X50 Pro有什么区别?打开相机就知道了更用心的外观设计画面风格各有特色夜景中的画质表现防抖效果对比结语
- 行业互联网|全球手机三巨头公布半年业绩!全面对比之后:华为差距还是非常大
- 英特尔|116项对比测试:Intel免费提速6% 一对比尴尬了
- |一文带你读懂区块链的本质
- 企鹅科技|红米K30“最铁三兄弟”,对比谁最有出息?看到大哥二哥网友懵了!
- AMD|116项对比测试:Intel至强免费提速6% 仍不敌AMD霄龙