千万级流量架构下的负载均衡解析( 二 )


千万级流量架构下的负载均衡解析

文章插图
 
3. 反向代理服务器
反向代理服务器位于源服务器前面,用户的请求需要先经过反向代理服务器才能到达源服务器 。反向代理可以用来进行缓存、日志记录等,同时也可以用来做为负载均衡服务器 。
在这种负载均衡转发方式下,客户端不直接请求源服务器,因此源服务器不需要外部 IP 地址,而反向代理需要配置内部和外部两套 IP 地址 。
优点:
  • 与其它功能集成在一起,部署简单 。
缺点:
  • 所有请求和响应都需要经过反向代理服务器,它可能会成为性能瓶颈 。
4. 网络层
在操作系统内核进程获取网络数据包,根据负载均衡算法计算源服务器的 IP 地址,并修改请求数据包的目的 IP 地址,最后进行转发 。
源服务器返回的响应也需要经过负载均衡服务器,通常是让负载均衡服务器同时作为集群的网关服务器来实现 。
优点:
  • 在内核进程中进行处理,性能比较高 。
缺点:
  • 和反向代理一样,所有的请求和响应都经过负载均衡服务器,会成为性能瓶颈 。
5. 链路层
在链路层根据负载均衡算法计算源服务器的 mac 地址,并修改请求数据包的目的 MAC 地址,并进行转发 。
通过配置源服务器的虚拟 IP 地址和负载均衡服务器的 IP 地址一致,从而不需要修改 IP 地址就可以进行转发 。也正因为 IP 地址一样,所以源服务器的响应不需要转发回负载均衡服务器,可以直接转发给客户端,避免了负载均衡服务器的成为瓶颈 。
【千万级流量架构下的负载均衡解析】这是一种三角传输模式,被称为直接路由 。对于提供下载和视频服务的网站来说,直接路由避免了大量的网络传输数据经过负载均衡服务器 。
这是目前大型网站使用最广负载均衡转发方式,在 linux 平台可以使用的负载均衡服务器为 LVS(Linux Virtual Server) 。
参考:
  • Comparing Load Balancing Algorithms
  • Redirection and Load Balancing
二、集群下的 Session 管理一个用户的 Session 信息如果存储在一个服务器上,那么当负载均衡器把用户的下一个请求转发到另一个服务器,由于服务器没有用户的 Session 信息,那么该用户就需要重新进行登录等操作 。
Sticky Session
需要配置负载均衡器,使得一个用户的所有请求都路由到同一个服务器,这样就可以把用户的 Session 存放在该服务器中 。
缺点:
  • 当服务器宕机时,将丢失该服务器上的所有 Session 。

千万级流量架构下的负载均衡解析

文章插图
 
Session Replication
在服务器之间进行 Session 同步操作,每个服务器都有所有用户的 Session 信息,因此用户可以向任何一个服务器进行请求 。
缺点:
  • 占用过多内存;
  • 同步过程占用网络带宽以及服务器处理器时间 。

千万级流量架构下的负载均衡解析

文章插图
 
Session Server
使用一个单独的服务器存储 Session 数据,可以使用传统的 MySQL,也使用 redis 或者 Memcached 这种内存型数据库 。
优点:
  • 为了使得大型网站具有伸缩性,集群中的应用服务器通常需要保持无状态,那么应用服务器不能存储用户的会话信息 。Session Server 将用户的会话信息单独进行存储,从而保证了应用服务器的无状态 。
缺点:
  • 需要去实现存取 Session 的代码 。

千万级流量架构下的负载均衡解析

文章插图
 




推荐阅读