图解Linux网络包接收过程

因为要对百万、千万、甚至是过亿的用户提供各种网络服务,所以在一线互联网企业里面试和晋升后端开发同学的其中一个重点要求就是要能支撑高并发,要理解性能开销,会进行性能优化 。而很多时候,如果你对linux底层的理解不深的话,遇到很多线上性能瓶颈你会觉得狗拿刺猬,无从下手 。
我们今天用图解的方式,来深度理解一下在Linux下网络包的接收过程 。还是按照惯例来借用一段最简单的代码开始思考 。为了简单起见,我们用udp来举例,如下:
int main(){    int serverSocketFd = socket(AF_INET, SOCK_DGRAM, 0);    bind(serverSocketFd, ...);    char buff[BUFFSIZE];    int readCount = recvfrom(serverSocketFd, buff, BUFFSIZE, 0, ...);    buff[readCount] = '';    printf("Receive from client:%sn", buff);}上面代码是一段udp server接收数据的逻辑 。当在开发视角看的时候,只要客户端有对应的数据发送过来,服务器端执行recv_from后就能收到它,并把它打印出来 。我们现在想知道的是,当网络包达到网卡,直到我们的recvfrom收到数据,这中间,究竟都发生过什么?
通过本文,你将深入理解Linux网络系统内部是如何实现的,以及各个部分之间如何交互 。相信这对你的工作将会有非常大的帮助 。本文基于Linux 3.10,源代码参见https://mirrors.edge.kernel.org/pub/linux/kernel/v3.x/,网卡驱动采用Intel的igb网卡举例 。
友情提示,本文略长,可以先Mark后看!

Linux网络收包总览
在TCP/IP网络分层模型里,整个协议栈被分成了物理层、链路层、网络层,传输层和应用层 。物理层对应的是网卡和网线,应用层对应的是我们常见的Nginx,FTP等等各种应用 。Linux实现的是链路层、网络层和传输层这三层 。
在Linux内核实现中,链路层协议靠网卡驱动来实现,内核协议栈来实现网络层和传输层 。内核对更上层的应用层提供socket接口来供用户进程访问 。我们用Linux的视角来看到的TCP/IP网络分层模型应该是下面这个样子的 。

图解Linux网络包接收过程

文章插图
 
图1 Linux视角的网络协议栈
在Linux的源代码中,网络设备驱动对应的逻辑位于driver/net/ethernet, 其中intel系列网卡的驱动在driver/net/ethernet/intel目录下 。协议栈模块代码位于kernel和net目录 。
内核和网络设备驱动是通过中断的方式来处理的 。当设备上有数据到达的时候,会给CPU的相关引脚上触发一个电压变化,以通知CPU来处理数据 。对于网络模块来说,由于处理过程比较复杂和耗时,如果在中断函数中完成所有的处理,将会导致中断处理函数(优先级过高)将过度占据CPU,将导致CPU无法响应其它设备,例如鼠标和键盘的消息 。因此Linux中断处理函数是分上半部和下半部的 。上半部是只进行最简单的工作,快速处理然后释放CPU,接着CPU就可以允许其它中断进来 。剩下将绝大部分的工作都放到下半部中,可以慢慢从容处理 。2.4以后的内核版本采用的下半部实现方式是软中断,由ksoftirqd内核线程全权处理 。和硬中断不同的是,硬中断是通过给CPU物理引脚施加电压变化,而软中断是通过给内存中的一个变量的二进制值以通知软中断处理程序 。
好了,大概了解了网卡驱动、硬中断、软中断和ksoftirqd线程之后,我们在这几个概念的基础上给出一个内核收包的路径示意:
图解Linux网络包接收过程

文章插图
 
图2 Linux内核网络收包总览
当网卡上收到数据以后,Linux中第一个工作的模块是网络驱动 。网络驱动会以DMA的方式把网卡上收到的帧写到内存里 。再向CPU发起一个中断,以通知CPU有数据到达 。第二,当CPU收到中断请求后,会去调用网络驱动注册的中断处理函数 。网卡的中断处理函数并不做过多工作,发出软中断请求,然后尽快释放CPU 。ksoftirqd检测到有软中断请求到达,调用poll开始轮询收包,收到后交由各级协议栈处理 。对于UDP包来说,会被放到用户socket的接收队列中 。
我们从上面这张图中已经从整体上把握到了Linux对数据包的处理过程 。但是要想了解更多网络模块工作的细节,我们还得往下看 。

Linux启动
Linux驱动,内核协议栈等等模块在具备接收网卡数据包之前,要做很多的准备工作才行 。比如要提前创建好ksoftirqd内核线程,要注册好各个协议对应的处理函数,网络设备子系统要提前初始化好,网卡要启动好 。只有这些都Ready之后,我们才能真正开始接收数据包 。那么我们现在来看看这些准备工作都是怎么做的 。


推荐阅读