把知识记在小本本上

将零散的知识点放在一个集中的地方,不断递归重构,形成一套为己所用的知识系统。

博客首页 | 小本本首页

结构体

结构体内存对齐

什么是内存对齐

现代计算机中内存空间都是按照 byte 划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定类型变量的时候经常在特 定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。

为什么要有内存对齐?

对齐的作用和原因:各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的 CPU 在访问 一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐.其他平台可能没有这种情况,但是最常见的是如果不按照适合其平台要求对 数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为 32 位系统)如果存放在偶地址开始的地方,那 么一个读周期就可以读出这 32bit ,而如果存放在奇地址开始的地方,就需要 2 个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该 32bit 数 据。显然在读取效率上下降很多。

总的来说,结构体的内存对齐是拿空间来换取时间。

计算

计算结构体的大小是一个特别热门的考点,要计算结构体的大小,首先要知道结构体内存对齐规则。

  1. 第一个成员在于结构体变量偏移量为 0 的地址处;

  2. 其他成员变量要对齐到 对齐数 的整数倍的地址处;

    对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。

    对齐数在 Windows 中 VS 下默认是 8,Linux 中默认是 4(Centos 7 下默认是8)。

  3. 机构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。

  4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

一些栗子

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
struct s1 {
char c1;
int i;
char c2;
}; // 12

struct s2 {
char c1;
char c2;
int i;
}; // 8

struct s3 {
double d;
char c;
int i;
}; // 16

struct s4 {
char c1;
struct s3 s;
double d;
}; // 32

修改默认对齐数

#pragma pack(n)

结构体传参

函数传参的时候,参数是需要压栈的。如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,性能下降。

结构体传参的时候,要传结构体的地址进去。

位段

什么是位段

举个栗子,下面的 A 就是一个位段:

1
2
3
4
5
6
struct A {
int _a : 2; // 2 代表这个 _a 占用 2 个比特位,int 占 32 个比特位
int _b : 5;
int _c : 10;
int _d : 30;
};

sizeof(struct A) -> 8

定义一个位段要注意

位段的成员必须是 int、unsigned int、signed int、char,位段中所有成员类型必须一致。

位段的定义和使用特别依赖于平台问题(可移植性差)。

位段的内存分配

  • 位段的成员可以是 int、unsigned int、signed int、char;
  • 位段的空间上是按照需要以 4 个字节(int)或者 1 个字节(char)的方式来开辟的;
  • 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

位段的跨平台问题

  • int 位段被方程有符号数还是无符号数是不确定的;
  • 位段中最大位的数目不能确定(16 位机器最大 16,32 位机器最大 32,写成 27,在 16 位机器会出问题);
  • 位段中的成员在内存中从左向右分配,还是从右向左分配尚未定义;
  • 当一个结构包含两个位段,第二个位段成员比较大,无法容纳第一个位段剩余的位时,时舍弃剩余的位还是利用,这是不确定的。

位段的应用

定制协议报头。

ip