长理职培——严老师 2021年国家电网招聘考试通信类高频考点:编程模型

_本文原题:2021年国家电网招聘考试通信类高频考点:编程模型
云计算:
云计算(CloudComputing)是由分布式计算(DistributedComputing)、并行处理(ParallelComputing)、网格计算(GridComputing)发展来的 , 其最基本的概念 , 是透过网络将庞大的计算处理程序自动分拆成无数个较小的子程序 , 再交由多部服务器所组成的庞大系统经搜寻、计算分析之后将处理结果回传给用户 。 透过这项技术 , 网络服务提供者可以在数秒之内 , 达成处理数以千万计甚至亿计的信息 , 达到和“超级计算机”同样强大效能的网络服务 , 是一种新兴的商业计算模型 。
云计算系统运用了许多技术 , 其中以编程模型、数据管理技术、数据存储技术、虚拟化技术、云计算平台管理技术最为关键 。
长理职培——严老师 2021年国家电网招聘考试通信类高频考点:编程模型
文章图片
1、编程模型
MapReduce是Google开发的java、Python、C++编程模型 , 它是一种简化的分布式编程模型和高效的任务调度模型 , 用于大规模数据集(大于1TB)的并行运算 。 严格的编程模型使云计算环境下的编程十分简单 。 MapReduce模式的思想是将要执行的问题分解成Map(映射)和Reduce(化简)的方式 , 先通过Map程序将数据切割成不相关的区块 , 分配(调度)给大量计算机处理 , 达到分布式运算的效果 , 再通过Reduce程序将结果汇整输出 。
2、海量数据分布存储技术
云计算系统由大量服务器组成 , 同时为大量用户服务 , 因此云计算系统采用分布式存储的方式存储数据 , 用冗余存储的方式保证数据的可靠性 。 云计算系统中广泛使用的数据存储系统是Google的GFS和Hadoop团队开发的GFS的开源实现HDFS 。
【长理职培——严老师 2021年国家电网招聘考试通信类高频考点:编程模型】GFS即Google文件系统(GoogleFileSystem) , 是一个可扩展的分布式文件系统 , 用于大型的、分布式的、对大量数据进行访问的应用 。 GFS的设计思想不同于传统的文件系统 , 是针对大规模数据处理和Google应用特性而设计的 。 它运行于廉价的普通硬件上 , 但可以提供容错功能 。 它可以给大量的用户提供总体性能较高的服务 。
一个GFS集群由一个主服务器(master)和大量的块服务器(chunkserver)构成 , 并被许多客户(Client)访问 。 主服务器存储文件系统所以的元数据 , 包括名字空间、访问控制信息、从文件到块的映射以及块的当前位置 。 它也控制系统范围的活动 , 如块租约(lease)管理 , 孤儿块的垃圾收集 , 块服务器间的块迁移 。 主服务器定期通过HeartBeat消息与每一个块服务器通信 , 给块服务器传递指令并收集它的状态 。 GFS中的文件被切分为64MB的块并以冗余存储 , 每份数据在系统中保存3个以上备份 。
客户与主服务器的交换只限于对元数据的操作 , 所有数据方面的通信都直接和块服务器联系 , 这大大提高了系统的效率 , 防止主服务器负载过重 。


    推荐阅读