C语言程序编译成可执行文件的过程

现在我们有一个C语言文件(hello.c):

1
2
3
4
5
6
#include <stdio.h>

int main() {
printf("hello, world!\n");
return 0;
}

现在我们将执行以下命令将源文件(hello.c)转化为可执行目标文件(hello):

1
gcc -o hello hello.c

我们使用的是gcc编译器驱动程序完成的。这个转化的过程可分为四个阶段完成。执行这四个阶段的程序(预处理器、编译器、汇编器和链接器)一起构成了编译系统。

1
hello.c(源程序[文本])->预处理器(cpp)->hello.i(修改了的源程序[文本])->编译器(ccl)->hello.s(汇编程序[文本])->汇编器(as)->hello.o(可重定位目标程序[二进制])->链接器(ld)->hello(可执行目标程序[二进制])
  • 预处理阶段。预处理器(cpp)根据字符#开头的命令,修改原始的C程序。结果就得到了另外一个C程序,通常是以**.i**作为文件扩展名。
  • 编译阶段。编译器(ccl)将文本文件hello.i翻译成文本文件hello.s,它包含一个汇编语言程序。汇编程序是非常有用的,它位不同高级语言的不同编译器提供了通用的输出语言。
  • 汇编阶段。汇编器(as)将hello.s翻译成机器语言指令,将这些指令打包成一种叫做可重定位目标程序的格式,并将格式保存在目标文件hello.o中。如果我们使用文本编辑器打开hello.o文件,将会看到一堆乱码。
  • 链接阶段。hello程序调用了printf函数,它是每个C编译器都会提供的标准C库中的一个函数。printf函数存在于一个名为printf.o的单独的预编译好了的目标文件中,而这个文件必须以某种方式合并到我们的hello.o程序中,链接器(ld)就是处理这种合并,结果就得到了hello文件。它是一个可执行文件,可以被加载到内存中,由系统执行。

来源于:《深入理解计算机系统》 · 第三版