深圳幻海软件技术有限公司 欢迎您!

结构体全解,适合初学者的一条龙深度讲解(附手绘图详解)

2023-04-12

我们知道,C语言是允许我们自己来创造类型的,这些类型就叫做——自定义类型。自定义类型又包括结构体类型,联合体类型还有枚举类型。今天的文章,我们就着重讲解这其中的结构体类型。目录结构体的声明1.1结构的基础知识1.2结构的声明1.3匿名结构体的情况1.4结构的自引用 1.5重命名匿名结构体的

我们知道,C语言是允许我们自己来创造类型的,这些类型就叫做——自定义类型。

自定义类型又包括结构体类型,联合体类型还有枚举类型。

今天的文章,我们就着重讲解这其中的结构体类型。

目录

结构体的声明

1.1结构的基础知识

1.2结构的声明

1.3 匿名结构体的情况

1.4结构的自引用

 1.5重命名匿名结构体的情况

1.6 结构体变量的定义和初始化

 1.7 结构体内存对齐

1.8为什么存在内存对齐?

1.9我们可以耍些小聪明达到节省空间的效果。

2.1修改默认对齐数

2.2 结构体传参

3.1位段

3.2 位段的内存分配

3.3 位段的跨平台问题

结构体的声明

1.1结构的基础知识

结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。

1.2结构的声明

struct tag
{
member-list;
}variable-list;

我们以这种方式来描述一个结构体。下面是简单的示范,我们来描述一个学生:

  1. struct Stu
  2. {
  3. char name[20];//名字
  4. int age;//年龄
  5. char sex[5];//性别
  6. char id[20];//学号
  7. }; //分号不能丢

 定义局部变量和全局变量的关系:

  1. #define _CRT_SECURE_NO_WARNINGS
  2. struct Stu
  3. {
  4. char name[20];//名字
  5. int age;//年龄
  6. char sex[5];//性别
  7. char id[20];//学号
  8. }s1,s2,s3; //全局变量
  9. int main()
  10. {
  11. struct Stu s4;
  12. struct Stu s5;//局部变量
  13. return 0;
  14. }

1.3 匿名结构体的情况

也可以省略不写结构体标签,不过这样会导致一个结果,结构体只能定义一次类型。

  1. #define _CRT_SECURE_NO_WARNINGS
  2. #include<stdio.h>
  3. struct
  4. {
  5. char name[20];//名字
  6. int age;//年龄
  7. char sex[5];//性别
  8. char id[20];//学号
  9. }s1; //全局变量
  10. struct
  11. {
  12. char name[20];//名字
  13. int age;//年龄
  14. char sex[5];//性别
  15. char id[20];//学号
  16. }*ps; //全局变量
  17. int main()
  18. {
  19. s1.age = 1;
  20. printf("%d", s1. age);
  21. return 0;
  22. }

  

在上述的代码中,体现为定义结构体变量s1之后,无法再次定义诸如s2,s3等结构体类型。

不过要是你本来就准备只用一次结构体的话,定义一个匿名结构体也不错就是了。 

上面的两个结构在声明的时候省略掉了结构体标签, 那么问题来了?

//在上面代码的基础上,下面的代码合法吗? 

ps=&s1; 

 答案是否定的,及时两个结构体里面的元素都相同,编译器也会他们当成两个完全不同的类型,所以是非法的。

1.4结构的自引用

我们想要使用结构体实现类似于链表的功能。

在结构中包含一个类型为该结构本身的成员是否可以呢? 
  1. #include<stdio.h>
  2. struct Node
  3. {
  4. int data;
  5. struct Node n;
  6. };
  7. int main()
  8. {
  9. return 0;
  10. }

 我们开动小脑筋,立马就发现了错误。

struct Node这个节点它所占用的空间有多大呢?

它不仅要存放一个整形,还要存放一个n。

这就无限循环下去了,struct Node里面还有一个struct Node。

大小是无法得出的,这是一个错误示范。

我们转变战略,用指针来实现。

  1. #define _CRT_SECURE_NO_WARNINGS
  2. #include<stdio.h>
  3. struct Node
  4. {
  5. int data;//4
  6. struct Node *next;//4/8
  7. };
  8. int main()
  9. {
  10. struct Node n1;
  11. struct Node n2;
  12. n1.next = &n2;
  13. return 0;
  14. }

创建两个节点n1,n2,把它们像链条一样串起来。 

 编译器没有报错,这样的写法是正确的,同时我们发现,struct Node的大小可以轻而易举地算出,我们得出一个结论:

不是在自己的类型里面包含一个自己类型的变量,而是在自己的类型里面包含一个自己类型的指针。这样的实现方式才是可行的。

 1.5重命名匿名结构体的情况

下面的代码是否可行呢?

  1. #include<stdio.h>
  2. typedef struct
  3. {
  4. int data;
  5. }S;
  6. int main()
  7. {
  8. return 0;
  9. }

 可行,不过S不再是匿名结构体的变量,而是变成了匿名结构体类型。

怎么用呢?这么用:

  1. #include<stdio.h>
  2. typedef struct
  3. {
  4. int data;
  5. }S;
  6. int main()
  7. {
  8. S s;
  9. s.data = 1;
  10. printf("%d", s.data);
  11. return 0;
  12. }

能用这种方式模拟实现上面的链表呢?

这样写行吗?

  1. typedef struct
  2. {
  3. int data;
  4. Node* next;
  5. }Node;

不行,在没有重命名出Node时就调用了Node。

在这种情况下,我们只能老老实实地写出类型名了!

  1. typedef struct Node
  2. {
  3. int data;
  4. struct Node* next;
  5. }Node;

1.6 结构体变量的定义和初始化

有了结构体类型,那如何定义变量,其实很简单。 

  1. int x;
  2. int y;
  3. }p1; //声明类型的同时定义变量p1
  4. struct Point p2; //定义结构体变量
  5. struct Point
  6. {
  7. p2
  8. //初始化:定义变量的同时赋初值。
  9. struct Point p3 = {x, y};
  10. struct Stu        //类型声明
  11. {
  12. char name[15];//名字
  13. int age;      //年龄
  14. };
  15. struct Stu s = {"zhangsan", 20};//初始化
  16. struct Node
  17. {
  18. int data;
  19. struct Point p;
  20. struct Node* next;
  21. }n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
  22. struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化

 1.7 结构体内存对齐

我们已经掌握了结构体的基本使用了。
现在我们深入讨论一个问题:计算结构体的大小。
这就到了本文的重中之重: 结构体内存对齐。

 计算以下的结构体大小。

  1. #include<stdio.h>
  2. int main()
  3. {
  4. struct S1
  5. {
  6. char c1;
  7. int i;
  8. char c2;
  9. };
  10. printf("%d\n", sizeof(struct S1));
  11. //练习2
  12. struct S2
  13. {
  14. char c1;
  15. char c2;
  16. int i;
  17. };
  18. printf("%d\n", sizeof(struct S2));
  19. //练习3
  20. struct S3
  21. {
  22. double d;
  23. char c;
  24. int i;
  25. };
  26. printf("%d\n", sizeof(struct S3));
  27. //练习4-结构体嵌套问题
  28. struct S4
  29. {
  30. char c1;
  31. struct S3 s3;
  32. double d;
  33. };
  34. printf("%d\n", sizeof(struct S4));
  35. }
运行结果如下:

 是不是跟想的完全不一样?

没错,结构体的大小并不是成员大小的简单相加,而是有自己的一套规则的。

  1.  结构体的第一个成员永远是放在零偏移处。
  2. 从第二个成员开始,以后每个对齐成员都要对齐到某个对齐数的整数倍处。
  3. 这个对齐数是成员自身大小和默认对齐数的较小值。
  4. VS中默认的值为8
  5.  结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
  6.  如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。如果不够,则浪费空间来对齐。

我们以s1为例子来试验一下上述规则,如图所示。 

因为从第二个成员开始,以后每个对齐成员都要对齐到某个对齐数的整数倍处。

所以1,2,3三个字节被浪费,int类型的存储从4开始到7,char类型存到8处。

最后结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。

 S1中最大对齐数为4,结构体总大小要为最大对齐数(每个成员变量都有一个对齐数)的整数倍。而现在大小为9,为了让其变为4的倍数,结构体S1的总大小变为12。

再看S4的情况:

白色为浪费部分,黄色为char,绿色是double,粉色是int。

1.8为什么存在内存对齐?

1.不同硬件平台不一定支持访问任意内存地址数据,某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。使用内存对齐可以保证每次访问都从块内存地址头部开始存取

2.提高cpu内存访问速度,内存是分块的,如两字节一块,四字节一块,考虑这种情况:一个四字节变量存在一个四字节地址的后三位和下一个四字节地址的前一位,这样cpu从内存中取数据便需要访问两个内存并将他们组合起来,降低cpu性能

用内存对齐达到了用空间换时间的效果

1.9我们可以耍些小聪明达到节省空间的效果。

让占用空间小的成员尽量集中在一起。
  1. //例如:
  2. struct S1
  3. {
  4. char c1;
  5. int i;
  6. char c2;
  7. };
  8. struct S2
  9. {
  10. char c1;
  11. char c2;
  12. int i;
  13. };

 S1S2类型的成员一模一样,但是S1S2所占空间的大小有了一些区别。

2.1修改默认对齐数

我们可以通过#pragma pack()指令来修改默认对齐数。

  1. #include <stdio.h>
  2. #pragma pack(1)
  3. //设置默认对齐数为1
  4. struct S1
  5. {
  6. char c1;
  7. int i;
  8. char c2;
  9. };
  10. int main()
  11. {
  12. //输出的结果是什么?
  13. printf("%d\n", sizeof(struct S1));
  14. return 0;
  15. }

 可以看到,答案不再是12,默认对齐数确实被修改了。

想要取消的话就引入一个空指令。

  1. #include <stdio.h>
  2. #pragma pack(1)//设置默认对齐数为1
  3. #pragma pack()//取消设置的默认对齐数,还原为默认
  4. struct S1
  5. {
  6. char c1;
  7. int i;
  8. char c2;
  9. };
  10. int main()
  11. {
  12. //输出的结果是什么?
  13. printf("%d\n", sizeof(struct S1));
  14. return 0;
  15. }

 

2.2 结构体传参

 下面print1和print2那个比较好?

  1. struct S
  2. {
  3. int data[1000];
  4. int num;
  5. };
  6. struct S s = {{1,2,3,4}, 1000};
  7. //结构体传参
  8. void print1(struct S s)
  9. {
  10. printf("%d\n", s.num);
  11. }
  12. //结构体地址传参
  13. void print2(struct S* ps)
  14. {
  15. printf("%d\n", ps->num);
  16. }
  17. int main()
  18. {
  19. print1(s);  //传结构体
  20. print2(&s); //传地址
  21. return 0;
  22. }
上面的 print1 print2 函数哪个好些?
答案是:首选print2函数。
原因:
  • 函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。
  • 如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。

所以结构体传参数时,要传结构体的地址。

3.1位段

结构体讲完就得讲讲结构体实现 位段 的能力。
  1. struct A
  2. {
  3. int _a:2;
  4. int _b:5;
  5. int _c:10;
  6. int _d:30;
  7. };

 A就是一个位段的类型,位段可以控制所给的空间大小,达到节省空间的目的。

 它所占空间是多大?

  1. #include <stdio.h>
  2. struct A
  3. {
  4. int _a : 2;
  5. int _b : 5;
  6. int _c : 10;
  7. int _d : 30;
  8. };
  9. int main()
  10. {
  11. printf("%d\n", sizeof(struct A));
  12. return 0;
  13. }

 它占了8*8=64个比特位。

从16个字节优化到8个字节,位段的功能可以说是十分强大。

3.2 位段的内存分配

1. 位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
  1. #include <stdio.h>
  2. //一个例子
  3. struct S
  4. {
  5. char a : 3;
  6. char b : 4;
  7. char c : 5;
  8. char d : 4;
  9. };
  10. int main()
  11. {
  12. struct S s = { 0 };
  13. s.a = 10;
  14. s.b = 12;
  15. s.c = 3;
  16. s.d = 4;
  17. //空间是如何开辟的?
  18. return 0;
  19. }
  • 首先做一个假设,假设内存中的比特位是由右向左使用的。
  • 一个字节内部,剩余的比特位不够使用时,直接浪费掉。

 

 我们猜想是这个样子。

转换成16进制为:

62  03  04

我们来调试看看:

 我们的猜想是正确的!

3.3 位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。( 16 位机器最大 16 32 位机器最大 32 ,写成 27 ,在 16 位机
器会出问题。
3. 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是
舍弃剩余的位还是利用,这是不确定的。
总结:
跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。

这篇博客旨在总结我自己阶段性的学习,要是能帮助到大家,那可真是三生有幸!😀如果觉得我写的不错的话还请点个赞和关注哦~我会持续输出编程的知识的!🌞🌞🌞 

文章知识点与官方知识档案匹配,可进一步学习相关知识
算法技能树首页概览43883 人正在系统学习中