产业气象站@只知道HDFS和GFS？你其实并不懂分布式文件系统( 二 ) 张轲

2、无中心节点
以ceph为代表，每个节点都是自治的、自管理的，整个ceph集群只包含一类节点，如下图(最下层红色的RADOS就是ceph定义的“同时包含meta数据和文件数据”的节点) 。

文章图片
ceph
无中心化的最大优点是解决了中心节点自身的瓶颈，这也就是ceph号称可以无限向上扩容的原因。但由Client直接和Server通信，那么Client必须要知道，当对某个文件进行操作时，它该访问集群中的哪个节点。 ceph提供了一个很强大的原创算法来解决这个问题——CRUSH算法。
CRUSH：https://ceph.com/wp-content/uploads/2016/08/weil-crush-sc06.pdf
五、持久化
对于文件系统来说，持久化是根本，只要Client收到了Server保存成功的回应之后，数据就不应该丢失。这主要是通过多副本的方式来解决，但在分布式环境下，多副本有这几个问题要面对。
如何保证每个副本的数据是一致的?如何分散副本，以使灾难发生时，不至于所有副本都被损坏?怎么检测被损坏或数据过期的副本，以及如何处理?该返回哪个副本给Client?1、如何保证每个副本的数据是一致的？
同步写入是保证副本数据一致的最直接的办法。当Client写入一个文件的时候， Server会等待所有副本都被成功写入，再返回给Client 。
这种方式简单、有保障，唯一的缺陷就是性能会受到影响。假设有3个副本，如果每个副本需要N秒，则可能会阻塞Client3N秒的时间，有几种方式，可以对其进行优化：
并行写：由一个副本作为主副本，并行发送数据给其他副本；链式写：几个副本组成一个链(chain) ，并不是等内容都接受到了再往后传播，而是像流一样，边接收上游传递过来的数据，一边传递给下游。还有一种方式是采用CAP中所说的W+R>N的方式，比如3副本(N=3)的情况， W＝2 ， R＝2 ，即成功写入2个就认为成功，读的时候也要从2个副本中读。这种方式通过牺牲一定的读成本，来降低写成本，同时增加写入的可用性。这种方式在分布式文件系统中用地比较少。
2、如何分散副本，以使灾难发生时，不至于所有副本都被损坏？
这主要避免的是某机房或某城市发生自然环境故障的情况，所以有一个副本应该分配地比较远。它的副作用是会带来这个副本的写入性能可能会有一定的下降，因为它离Client最远。所以如果在物理条件上无法保证够用的网络带宽的话，则读写副本的策略上需要做一定考虑。
可以参考同步写入只写2副本、较远副本异步写入的方式，同时为了保证一致性，读取的时候又要注意一些，避免读取到异步写入副本的过时数据。
3、怎么检测被损坏或数据过期的副本，以及如何处理？
如果有中心节点，则数据节点定期和中心节点进行通信，汇报自己的数据块的相关信息，中心节点将其与自己维护的信息进行对比。如果某个数据块的checksum不对，则表明该数据块被损坏了；如果某个数据块的version不对，则表明该数据块过期了。
如果没有中心节点，以ceph为例，它在自己的节点集群中维护了一个比较小的monitor集群，数据节点向这个monitor集群汇报自己的情况，由其来判定是否被损坏或过期。
当发现被损坏或过期副本，将它从meta信息中移除，再重新创建一份新的副本就好了，移除的副本在随后的回收机制中会被收回。
4、该返回哪个副本给Client？
这里的策略就比较多了，比如round-robin、速度最快的节点、成功率最高的节点、CPU资源最空闲的节点、甚至就固定选第一个作为主节点，也可以选择离自己最近的一个，这样对整体的操作完成时间会有一定节约。
六、伸缩性

产业气象站@只知道HDFS和GFS？你其实并不懂分布式文件系统( 二 )

推荐阅读

【】白宫竖起2米多高铁丝网，门前再度被抗议者占据

十大商务男装品牌

封神榜接引道人,接引道人和准提道人,封神之后都成了谁--

我亲哥说要娶我咋办

在上海开公司需要什么条件

Intel|游戏性能回来了 11代酷睿喜加一：《杀手3》免费送

『5g手机』小米又大跳水，5G双模+128GB+120Hz刷新率，上架半个月直降400元

安卓|消息称iPhone15全系将采用叹号屏你会买单？苹果全面屏手机/平板加速到来

数控|这两只精选层股票股价接近翻番：汇添富、嘉实、金长川等10家战投赚了

雨沐网络孟琬|之前你买过吗，《绝地求生》再无千元以上服饰,

医务工作者小贾|指甲上有竖纹，是生病了吗？听听医生怎么说

周到|比利时国宴冰淇淋在这未展先销，打造“永不落幕的进博会”，这一主阵地今年还有大变化

爱龙爱炫车|突然全身瘫痪，靠轮椅生活，马上要成为湖南台“一姐”

最新！紧凑型车“油耗”榜单更新，冠军不足5L，轩逸比朗逸省油

大众报业·海报新闻|财鑫闻丨首批200亿科创50ETF本周袭来！科创板50指数值得投吗？

香酥|1碗面粉加2个鸡蛋，教你做香酥小饼干，酥香脆爽，比面包还好吃

公司|[公司]ST八菱：股票交易异常波动无未披露重要事项

擦肩而过 “擦肩而过”的TCL与华为，终会“相遇”

感言|沈梦辰发布视频版淘汰感言：最对不住“大碗宽面”组的伙伴

上单|上单霸主老夫子，进阶攻略，进可攻，退可守，上分如喝水