C语言程序编译成可执行文件的过程

发表于 2018-02-03 更新于 2023-07-15 分类于编程语言， C

现在我们有一个C语言文件（hello.c）：

#include <stdio.h>

int main() {
    printf("hello, world!\n");
    return 0;
}

现在我们将执行以下命令将源文件（hello.c）转化为可执行目标文件（hello）：

1	gcc -o hello hello.c

我们使用的是gcc编译器驱动程序完成的。这个转化的过程可分为四个阶段完成。执行这四个阶段的程序（预处理器、编译器、汇编器和链接器）一起构成了编译系统。

hello.c(源程序[文本])->预处理器(cpp)->hello.i(修改了的源程序[文本])->编译器(ccl)->hello.s(汇编程序[文本])->汇编器(as)->hello.o(可重定位目标程序[二进制])->链接器(ld)->hello(可执行目标程序[二进制])

预处理阶段。预处理器(cpp)根据字符#开头的命令，修改原始的C程序。结果就得到了另外一个C程序，通常是以**.i**作为文件扩展名。
编译阶段。编译器(ccl)将文本文件hello.i翻译成文本文件hello.s，它包含一个汇编语言程序。汇编程序是非常有用的，它位不同高级语言的不同编译器提供了通用的输出语言。
汇编阶段。汇编器(as)将hello.s翻译成机器语言指令，将这些指令打包成一种叫做可重定位目标程序的格式，并将格式保存在目标文件hello.o中。如果我们使用文本编辑器打开hello.o文件，将会看到一堆乱码。
链接阶段。hello程序调用了printf函数，它是每个C编译器都会提供的标准C库中的一个函数。printf函数存在于一个名为printf.o的单独的预编译好了的目标文件中，而这个文件必须以某种方式合并到我们的hello.o程序中，链接器(ld)就是处理这种合并，结果就得到了hello文件。它是一个可执行文件，可以被加载到内存中，由系统执行。

来源于：《深入理解计算机系统》 · 第三版