Linux内存管理之MMU的过程

之前写过一篇《CPU是如何访问内存的?》的文章,简单介绍了cpu访问内存的过程 。有了之前的感性认识,这篇站在arm的角度再深度讲解一下,看完你会发现不理解arm原理就直接撸内核代码简直是耍流氓 。
 
ARMv8中的访问内存流程我喜欢用图的方式来说明问题,简单直接:

Linux内存管理之MMU的过程

文章插图
蓝色部分是cpu,灰色部分是内存,白色部分就是cpu访问内存的过程,也是地址转换的过程 。在解释地址转换的本质前我们先理解下几个概念:
  1. TLB:MMU工作的过程就是查询页表的过程 。如果把页表放在内存中查询的时候开销太大,因此为了提高查找效率,专门用一小片访问更快的区域存放地址转换条目 。(当页表内容有变化的时候,需要清除TLB,以防止地址映射出错 。)
  2. Caches:cpu和内存之间的缓存机制,用于提高访问速率,armv8架构的话上图的caches其实是L2 Cache,这里就不做进一步解释了 。
「那么CPU是如何通过MMU和Cache来访问内存的呢?」
Linux内存管理之MMU的过程

文章插图
可以看出虚拟地址和物理地址的转换关键是过程Table Walk Unit 。
 
虚拟地址转换为物理地址的本质我们知道内核中的寻址空间大小是由CONFIG_ARM64_VA_BITS控制的,这里以48位为例,ARMv8中,Kernel Space的页表基地址存放在TTBR1_EL1寄存器中,User Space页表基地址存放在TTBR0_EL0寄存器中,其中内核地址空间的高位为全1,(0xFFFF0000_00000000 ~ 0xFFFFFFFF_FFFFFFFF),用户地址空间的高位为全0,(0x00000000_00000000 ~ 0x0000FFFF_FFFFFFFF)
Linux内存管理之MMU的过程

文章插图
有了宏观概念,下面我们以内核态寻址过程为例看下是如何把虚拟地址转换为物理地址的 。
我们知道linux采用了分页机制,通常采用四级页表,页全局目录(PGD),页上级目录(PUD),页中间目录(PMD),页表(PTE) 。如下:
Linux内存管理之MMU的过程

文章插图
  1. 从CR3寄存器中读取页目录所在物理页面的基址(即所谓的页目录基址),从线性地址的第一部分获取页目录项的索引,两者相加得到页目录项的物理地址 。
  2. 第一次读取内存得到pgd_t结构的目录项,从中取出物理页基址取出,即页上级页目录的物理基地址 。
  3. 从线性地址的第二部分中取出页上级目录项的索引,与页上级目录基地址相加得到页上级目录项的物理地址 。
  4. 第二次读取内存得到pud_t结构的目录项,从中取出页中间目录的物理基地址 。
  5. 从线性地址的第三部分中取出页中间目录项的索引,与页中间目录基址相加得到页中间目录项的物理地址 。
  6. 第三次读取内存得到pmd_t结构的目录项,从中取出页表的物理基地址 。
  7. 从线性地址的第四部分中取出页表项的索引,与页表基址相加得到页表项的物理地址 。
  8. 第四次读取内存得到pte_t结构的目录项,从中取出物理页的基地址 。
  9. 从线性地址的第五部分中取出物理页内偏移量,与物理页基址相加得到最终的物理地址 。
  10. 第五次读取内存得到最终要访问的数据 。
整个过程是比较机械的,每次转换先获取物理页基地址,再从线性地址中获取索引,合成物理地址后再访问内存 。不管是页表还是要访问的数据都是以页为单位存放在主存中的,因此每次访问内存时都要先获得基址,再通过索引(或偏移)在页内访问数据,因此可以将线性地址看作是若干个索引的集合 。
 
linux中对地址转换的实现/*描述各级页表中的页表项*/typedef struct { pteval_t pte; } pte_t;typedef struct { pmdval_t pmd; } pmd_t;typedef struct { pudval_t pud; } pud_t;typedef struct { pgdval_t pgd; } pgd_t;/* 将页表项类型转换成无符号类型 */#define pte_val(x)((x).pte)#define pmd_val(x)((x).pmd)#define pud_val(x)((x).pud)#define pgd_val(x)((x).pgd)/* 将无符号类型转换成页表项类型 */#define __pte(x)((pte_t) { (x) } )#define __pmd(x)((pmd_t) { (x) } )#define __pud(x)((pud_t) { (x) } )#define __pgd(x)((pgd_t) { (x) } )/* 获取页表项的索引值 */#define pgd_index(addr)(((addr) >> PGDIR_SHIFT) & (PTRS_PER_PGD - 1))#define pud_index(addr)(((addr) >> PUD_SHIFT) & (PTRS_PER_PUD - 1))#define pmd_index(addr)(((addr) >> PMD_SHIFT) & (PTRS_PER_PMD - 1))#define pte_index(addr)(((addr) >> PAGE_SHIFT) & (PTRS_PER_PTE - 1))/* 获取页表中entry的偏移值 */#define pgd_offset(mm, addr)(pgd_offset_raw((mm)->pgd, (addr)))#define pgd_offset_k(addr)pgd_offset(&init_mm, addr)#define pud_offset_phys(dir, addr)(pgd_page_paddr(*(dir)) + pud_index(addr) * sizeof(pud_t))#define pud_offset(dir, addr)((pud_t *)__va(pud_offset_phys((dir), (addr))))#define pmd_offset_phys(dir, addr)(pud_page_paddr(*(dir)) + pmd_index(addr) * sizeof(pmd_t))#define pmd_offset(dir, addr)((pmd_t *)__va(pmd_offset_phys((dir), (addr))))#define pte_offset_phys(dir,addr)(pmd_page_paddr(READ_ONCE(*(dir))) + pte_index(addr) * sizeof(pte_t))#define pte_offset_kernel(dir,addr)((pte_t *)__va(pte_offset_phys((dir), (addr))))


推荐阅读