薄情先生|结构体的字节对齐


薄情先生|结构体的字节对齐先说结论:sizeof求得的结构体的大小并不一定等于各个数据成员的大小之和 。
struct A {int x;int y;double z;};struct B {int x;double y;int z;};比如有如上两个结构体:A和B 。 都含有两个int型 , 一个double型数据成员 , 但成员的顺序不一样 。
薄情先生|结构体的字节对齐如上图所示 , int 和 double 分别为4个字节和8个字节 。 而结构体A和B使用sizeof的结果分别为16个字节和24个字节 。
可以看出结构体B所占的字节数并不等于其成员之和:
sizeof(B) ≠ sizeof(int) + sizeof(double) + sizeof(int)
之所以出现这样的结果 , 就是因为编译器要对结构体的数据成员在空间上进行字节对齐 。
一、什么是字节对齐现代计算机中 , 内存空间是按照字节划分的 , 理论上可以从任意起始地址访问任意类型的变量 。 但在实际中 , 访问特定类型变量时经常在特定的内存地址 , 这就需要各种数据类型按照一定的规则在空间上排列 , 而不是一个接一个地顺序存放 。 这就是所说的字节对齐 。
字节对齐主要针对的就是结构体 。
二、为什么需要字节对齐字节对齐的一个原因是:各个硬件平台对某些特定类型的数据只能从某些特定地址开始存取 。 比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误 , 在这种架构下编程必须保证字节对齐 。
其他平台可能没有这种情况 , 但是最常见的是如果不按照适合其平台要求对数据存放进行对齐 , 则会在存取效率上带来损失 。
薄情先生|结构体的字节对齐三、字节对齐的规则字节对齐的规则如下:

  1. 结构体的大小等于其最大成员的整数倍;
  2. 结构体成员的首地址相对于结构体首地址的偏移量是其类型大小的整数倍 。 比如double型成员的首地址相对于结构体首地址的偏移量应该是8的倍数;
  3. 满足前两条规则后 , 编译器会在结构体成员之后进行字节填充 。
基于上述三条规则 , 可以把结构体的首地址和每个成员的首地址打印出来看一下 , 如下图所示 。
薄情先生|结构体的字节对齐如上图所示 ,
  • 结构体sa和sb中 , 第一个成员x的首地址与结构体的地址相同 , 因为结构体不会在第一个数据成员之前进行字节填充;
  • 在结构体sa中 , y的首地址相比x偏移了4个字节 , z的首地址相比x偏移了8个字节 , 满足上述规则 , 结构体A所占的总空间为16个字节;
  • 而在结构sb中 , x的首地址是0 , 占用4个字节;而y是double类型 , 占用8个字节 , 但x只占用了4个字节 , 为了满足规则2 , 需要在x后面填充4个字节 , 因此y的首地址为8;x和y总共占用了16个字节 , z首地址又从0开始 , 而z是int类型 , 但为什么结构体B所占的字节不是16+4=20呢?这是因为规则1(结构体的大小等于其最大成员的整数倍) , 由于结构体最大成员是double类型 , 8个字节 , 因此还需要在z后面填充4个字节 , 即结构体总共占24个字节 。

薄情先生|结构体的字节对齐从上面可以看出 , 虽然结构体A和B包含的成员相同 , 但因为顺序不同 , 就导致结构体B比A多占了50%的空间 , 当结构体的数量足够多时 , B比A所多占的空间就非常客观了 。


推荐阅读