想听听 .c 到 .exe 的故事吗？

2年前 (2023-02-07)未命名147

想听听 .c 到 .exe 的故事吗？ Claffic_ 于2023-02-04 21:41:00发布 3800 收藏 132 分类专栏： C语言学习文章标签： c语言数据结构开发语言 c++ C语言学习专栏收录该内容 10 篇文章 1 订阅订阅专栏

欢迎来到 Claffic 的博客 💞💞💞

前言：

在用C语言写代码前，我们会先创建一个或多个源文件（.c 文件），最终源文件会变成可执行文件（.exe 文件），你知道这期间经历了什么吗？听我细细讲解 ~

🥰Part1. 程序的翻译环境和执行环境

😛Part2. 编译与链接

2.1 翻译环境

2.2. 编译的几个阶段

2.2.1 预编译

2.2.2 编译

2.2.3 汇编

2.3 链接

Part1. 程序的翻译环境和执行环境在 ANSI C 的任何一种实现中，存在两个不同的环境：第一种是翻译环境，在这个环境中源代码被转换为可执行的机器指令；第二种是执行环境，它用于实际执行代码。

简单的图示

接下来我会给大家依次讲解这两个过程

Part2. 编译与链接 2.1 翻译环境

如图，每个源文件单独经过编译器处理，生成目标文件，所有目标文件与链接库一起，在链接器的作用下生成可执行文件。

演示：

创建一个项目，在这个项目下创建三个源文件：

内容如下：

//test.c #include<stdio.h> extern Add(int, int); extern Sub(int, int); int main() { int a = 20; int b = 30; int c = Add(a, b); int d = Sub(a, b); printf("%d\n", c); printf("%d\n", d); return 0; } //Add.c int Sub(int x, int y) { return x + y; } //Sub.c int Add(int x, int y) { return x - y; }

运行后,

查看 .exe 文件：

查看 .obj 文件：

是不是与上述过程一样呢

一些细节：

• 组成一个程序的每个源文件通过编译过程分别转换成目标代码（object code）；

• 每个目标文件由链接器（linker）捆绑在一起，形成一个单一而完整的可执行程序；

• 链接器同时也会引入标准C函数库中任何被该程序所用到的函数，而且它可以搜索程序员个人的程序库，将其需要的函数也链接到程序中。

2.2. 编译的几个阶段

我们已经知道了，源文件变成可执行文件需要编译和链接两个过程，那么编译本身有哪些阶段呢？

我是图示

由图示可看出：编译经历的阶段有预编译 --> 编译 --> 汇编

接下来细讲每个过程：

注：由于 VS2022 属于集成开发环境，不方便展示细节，

所以接下来我会使用 Linux 环境下的 gcc 来演示编译和链接的过程。

为方便起见，我们只使用 test.c 和 Add.c 文件。

2.2.1 预编译

首先把刚才的代码写入文件：

这时我们只进行预编译

输入指令： gcc test.c -E （-E 就是预编译后停下来）

回车

会发现预编译的结果直接输出在屏幕上了：其实内容非常多，这里选取部分

我希望把预编译的内容放在一个文件中

输入指令： gcc test.c -E -o test.i

此时就多了一个 test.i 文件

对 Add.c 进行相同的操作 gcc Add.c -E -o Add.i

打开相应的文件 vim test.i

有足足800多行代码：

这时会问了：为什么预编译后出现了这么多代码？

回想一下，我们的 test.c 里面有什么内容来着？

#include<stdio.h>

没错，就是引了头文件，可以理解为：在预编译过程中将相关的头文件进行了展开

于是就有了预编译的第一条操作：

• 头文件的包含

接下来我在 test.c 文件中加入以下代码：

重新预编译 test.c 到 test.i 中：

可以发现：MAX被替换，注释也消失了；

• define 定义符号的替换

• 注释删除

小总结：

预编译阶段中进行的操作：

• 头文件的包含

• define 定义符号的替换

• 注释删除

都属于文本操作

2.2.2 编译

我们接下来要做的就是让预编译后的文件只进行编译操作

输入指令： gcc test.i -S

可见生成了一个 test.s 的文件

打开 test.s :

可见里面是一些汇编代码

其实这就是编译阶段的主要操作：

• 把C语言代码翻译成汇编代码

再深入些，

翻译的过程有：

1. 语法分析

2. 词法分析

3. 语义分析

4. 符号汇总

其实前三个过程比较好理解，就像我们读英语一样，要把英语转换成中文来理解。像这些分析，其实就是把C语言代码转换成汇编能理解的代码。

符号汇总就比较特殊，这里拿出细讲：

符号汇总，其实就是把一个文件中那些全局的符号汇总到一起

比如：

红色方块部分是汇总出的符号

某种意义上，汇总的符号是函数的符号。那这有什么用呢？先不急，接着看。

2.2.3 汇编

进一步，令编译后的文件只进行汇编操作

输入指令： gcc test.s -c

又出现了新的 test.o 文件

打开 test.o ：

嗯，看不懂。

其实是二进制啦 ~ 当然看不懂

那么汇编的操作也显而易见了：

• 把汇编指令翻译成二进制指令

其中又有一个重要的过程：形成符号表

我们说了看不懂，那谁能帮我们看懂呢？

在 Linux环境下：

test.o 和可执行文件的格式是 elf ，理应， readelf 可以读

输入命令： readelf test.o -s

这不，汇总的符号就出现了。

形成符号表，其实就是把汇总出的符号赋予一个临时地址

2.3 链接

链接链接，通俗来讲就是把多个文件连接起来

链接进行的操作：

• 合并段表

• 符号表的合并和重定位

合并段表解释：

前面提到 .o 文件和可执行文件都是 elf 格式，elf 格式本身具有段，

.o 文件在形成可执行文件的过程中会把相对应的段合并

图示

符号表的合并和重定位：

前面提到了形成符号表，并赋予了一个临时地址，

它们最终会合并到一起

对于出现一次的符号来说，地址可以直接用临时赋予的地址；

而对于出现多次的符号来说，地址不统一，就需要重新定位。

图示

总结：

听了 .c 到 .exe 的故事，是不是感觉 .c 到 .exe 道路有些艰辛呢？

一图总结

码文不易

如果你觉得这篇文章还不错并且对你有帮助，不妨支持一波哦 💗💗💗

标签: [db:标签TAG]

返回列表

上一篇：Spring Security在前端后端分离项目中的使用

下一篇：98年表示真干不过，部门新来的00后测试员已把我卷崩溃，想离职了...

想听听 .c 到 .exe 的故事吗？

相关文章

10款最佳在线地图软件介绍

程序员为什么要写技术博客？都在哪些平台呢？

用 JavaScript 写一个新年倒计时

【Python】控制自己的手机摄像头拍照，并自动发送到邮箱

实时手势识别(C++与python都可实现)

又发现一个ChatGPT国内镜像站，无次数限制也无广告

Copyright Your WebSite.Some Rights Reserved.

Powered By Z-BlogPHP. Theme by TOYEAN.

想听听 .c 到 .exe 的故事吗？

相关文章

10款最佳在线地图软件介绍

程序员为什么要写技术博客？都在哪些平台呢？

用 JavaScript 写一个新年倒计时

【Python】控制自己的手机摄像头拍照，并自动发送到邮箱

实时手势识别(C++与python都可实现)

又发现一个ChatGPT国内镜像站，无次数限制也无广告

Copyright Your WebSite.Some Rights Reserved.var _hmt = _hmt || [];(function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?30b336128641baa43b1404dd15891277"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s);})();

Powered By Z-BlogPHP. Theme by TOYEAN.

Copyright Your WebSite.Some Rights Reserved.