本文共 6400 字,大约阅读时间需要 21 分钟。
一、快速理解
更改C编译器的缺省字节对齐方式
在缺省情况下,C编译器为每一个变量或是数据单元按其自然对界条件分配空间。一般地,可以通过下面的方法来改变缺省的对界条件:使用伪指令#pragma pack (n),C编译器将按照n个字节对齐。使用伪指令#pragma pack (),取消自定义字节对齐方式。__attribute((aligned (n))),让所作用的结构成员对齐在n字节自然边界上。如果结构中有成员的长度大于n,则按照最大成员的长度来对齐。__attribute__ ((packed)),取消结构在编译过程中的优化对齐,按照实际占用字节数进行对齐。
举例说明
三 编译器是按照什么样的原则进行对齐的?
先让我们看四个重要的基本概念:
有了这些值,我们就可以很方便的来讨论具体数据结构的成员和其自身的对齐方式。有效对齐值N是最终用来决定数据存放地址方式的值。有效对齐N,就是表示“对齐在N上”,也就是说该数据的”存放起始地址%N=0”。而数据结构中的数据变量都是按定义的先后顺序来排放的。第一个数据变量的起始地址就是数据结构的起始地址。结构体的成员变量要对齐排放,结构体本身也要根据自身的有效对齐值圆整(就是结构体成员变量占用总长度需要是对结构体有效对齐值的整数倍)。
四 案例分析
struct B{ char b; int a; short c;};
sizeof(B) = 12
假设B从地址空间0x0000开始排放。该例子中没有定义指定对齐值,在笔者环境下,该值默认为4。
第一个成员变量b的自身对齐值是1,比指定或者默认指定对齐值4小,所以其有效对齐值为1,所以其存放地址0x0000符合0x0000%1=0。
第二个成员变量a,其自身对齐值为4,所以有效对齐值也为4,所以只能存放在起始地址为0x0004到0x0007这四个连续的字节空间中,符合0x0004%4=0,且紧靠第一个变量。
第三个变量c,自身对齐值为2,所以有效对齐值也是2,可以存放在0x0008到0x0009这两个字节空间中,符合0x0008%2=0。所以从0x0000到0x0009存放的都是B内容。
再看数据结构B的自身对齐值为其变量中最大对齐值(这里是b)所以就是4,所以结构体的有效对齐值也是4。根据结构体圆整的要求,0x0009到0x0000=10字节,(10+2)%4=0。所以0x0000A到0x000B也为结构体B所占用。故B从0x0000到0x000B共有12个字节,sizeof(struct B)=12;其实如果就这一个就来说它已将满足字节对齐了,因为它的起始地址是0,因此肯定是对齐的,之所以在后面补充2个字节,是因为编译器为了实现结构数组的存取效率,试想如果我们定义了一个结构B的数组,那么第一个结构起始地址是0没有问题,但是第二个结构呢?按照数组的定义,数组中所有元素都是紧挨着的,如果我们不把结构的大小补充为4的整数倍,那么下一个结构的起始地址将是0x0000A,这显然不能满足结构的地址对齐了,因此我们要把结构补充成有效对齐大小的整数倍。其实诸如:对于char型数据,其自身对齐值为1,对于short型为2,对于int,float,double类型,其自身对齐值为4,这些已有类型的自身对齐值也是基于数组考虑的,只是因为这些类型的长度已知了,所以他们的自身对齐值也就已知了。
2.案例2
#pragma pack (2)struct C{ char b; int a; short c;};#pragma pack ()
sizeof(C) = 8
第一个变量b的自身对齐值为1,指定对齐值为2,所以,其有效对齐值为1,假设C从0x0000开始,那么b存放在0x0000,符合0x0000%1=0;
第二个变量,自身对齐值为4,指定对齐值为2,所以有效对齐值为2,所以顺序存放在0x0002、0x0003、0x0004、0x0005四个连续字节中,符合0x0002%2=0。 第三个变量c的自身对齐值为2,所以有效对齐值为2,顺序存放在0x0006、0x0007中,符0x0006%2=0。所以从0x0000到0x00007共八字节存放的是C的变量。又C的自身对齐值为4,所以C的有效对齐值为2。又8%2=0,C只占用0x0000到0x0007的八个字节。所以sizeof(struct C)=8。#includeusing namespace std;// 默认对齐方式 4struct A { int a; char b; short c;};struct B { char b; int a; short c;};// 指定按2字节对齐#pragma pack (2)struct C { char b; int a; short c;};// 取消指定对齐,恢复缺省对齐#pragma pack ()// 指定按1字节对齐#pragma pack (1)struct D { char b; int a; short c;};//取消指定对齐,恢复缺省对齐#pragma pack ()int main(){ int *a; cout<<"sizeof(指针)->"< < "< < "< < "< < "< < "< < "< < "< < "< < "< <
(64位)
A内存布局
B内存布局
C内存布局
D内存布局
#includeusing namespace std;// 结构体的自身对齐值(4)#pragma pack (4)struct S{ int id; double height; float weight;};#pragma pack ()// 结构体的自身对齐值:其成员中自身对齐值最大值(8)/* 默认情况:24 int [0] - [3] double [8] - [15] float [16] - [19]*/struct Student{ int id; double height; float weight;};/* 默认情况:48 char [0] - [1] int [4] - [7] double [8] - [15] short [16] - [17] Student [24] - [47]*/struct StudentInfo{ char name[2]; int id; double socore; short grade; Student stu;};int main(){ cout<<"sizeof(S)->"< < "< < "< <
S内存布局 sizeof(S) = 16
Student内存布局 sizeof(Student) = 24
StudentInfo内存布局 sizeof(StudentInfo) = 48
#include#include //#pragma pack(1) /* n = 1, 2, 4, 8, 16 */ /* 默认情况:24 int [0] - [3] double [8] - [15] float [16] - [19] */ typedef struct bb { int id; double weight; float height; }BB; /* 默认情况:48 char [0] - [1] int [4] - [7] double [8] - [15] short [16] - [17] BB [24] - [47] */ typedef struct aa { char name[2]; int id; double score; short grade; BB b; }AA; /* 默认情况:12 */ typedef struct cc { char x1; short x2; float x3; char x4; }CC; /*默认情况:8 int [0] - [3] char [4] short [6] - [7] [0][1][2][3] [4][5][6][7] char 补充一个字节占据两个字节 short 占据两个字节 #pragma pack(2) 8 int [0] - [3] char [4] short [6] - [7] [0][1] [2][3] [4][5] [6][7] #pragma pack(1) 7 int [0] - [3] char [4] short [5] - [6] [0] [1] [2] [3] [4] [5] [6] */ typedef struct dd { int x1; char x2; short x3; }DD; /*默认情况:12 char [0] int [4] - [7] short [8] - [9] [0][1][2][3] [4][5][6][7] [8][9][10][11] #pragma pack(2) 8 char [0] int [2] - [5] short [6] - [7] [0][1] [2][3] [4][5] [6][7] #pragma pack(1) 7 char [0] int [1] - [4] short [5] - [6] [0] [1] [2] [3] [4] [5] [6] */ typedef struct ee { char x1; int x2; short x3; }EE; int main() { printf("int:%d char:%d short:%d double:%d float:%d\n",sizeof(int),sizeof(char),sizeof(short),sizeof(double),sizeof(float)); printf("sizeof(AA):%d\n",sizeof(AA)); printf("sizeof(BB):%d\n",sizeof(BB)); printf("sizeof(CC):%d\n",sizeof(CC)); printf("sizeof(DD):%d\n",sizeof(DD)); printf("sizeof(EE):%d\n",sizeof(EE)); return 0; }
例题:若是在32bit机器上,使用gcc编译器,得到的sizeof(A)和sizeof(B)分别为多少?
class A{ int a; short b; int c; char d;};class B{ double a; short b; int c; char d;};
网友解析:
第一个我个人的理解的对齐 要满足2点
(1) 每个元素的起始位置要能被其大小(字节数)整除 (2) 总体大小要能被最大的元素大小整除 那么第一个 int a :[0..3] short b :[4..5] int c 起点要能被4整除 所以是[8..11] char d [12..13] 一共[0..14]是15个byte 总体要设置为最大(int) 4的倍数 所以应该占16 byte第二个
double a : [0..7] short b : [8..9] int c 起点要能被4整除[12..15] char d [16,17]一个 [0..17]是18个byte
总体要设置为最大(double) 8的倍数, 所以应该占24 byte例题:在x86 32架构编译中,预设的结构成员对齐编译选项为8字节,计算sizeof(Foo)
struct Foo{ float f; char c; int32_t i;}
结构体Foo的自身对齐值为数据成员最大的自身对齐值int32_t的值为4。
有效对齐值为自身对齐值和预设对齐值的较小值即8和4的较小者为4。综述:sizeof(Foo) = 12