万字长文详解 Go 程序是怎样跑起来的?


万字长文详解 Go 程序是怎样跑起来的?

文章插图
作者 | qcrao
责编 | 屠敏
出品 | CSDN博客
刚开始写这篇文章的时候,目标非常大,想要探索 Go 程序的一生:编码、编译、汇编、链接、运行、退出 。它的每一步具体如何进行,力图弄清 Go 程序的这一生 。
在这个过程中,我又复习了一遍《程序员的自我修养》 。这是一本讲编译、链接的书,非常详细,值得一看!数年前,我第一次看到这本书的书名,就非常喜欢 。因为它模仿了周星驰喜剧之王里出现的一本书 ——《演员的自我修养》 。心向往之!
在开始本文之前,先推荐一位头条大佬的博客——《面向信仰编程》,他的 Go 编译系列文章,非常有深度,直接深入编译器源代码,我是看了很多遍了 。博客链接可以从参考资料里获取 。
理想很大,实现的难度也是非常大 。为了避免砸了“深度解密”这个牌子,这次起了个更温和的名字 。
下面是文章的目录:
万字长文详解 Go 程序是怎样跑起来的?

文章插图

1.引入我们从一个 HelloWorld 的例子开始:
package main import "fmt"funcmain{fmt.Println("hello world")}当我用我那价值 1800 元的 cherry 键盘潇洒地敲完上面的 hello world 代码时,保存在硬盘上的 hello.go 文件就是一个字节序列了,每个字节代表一个字符 。
用 vim 打开 hello.go 文件,在命令行模式下,输入命令:
:%!xxd就能在 vim 里以十六进制查看文件内容:
万字长文详解 Go 程序是怎样跑起来的?

文章插图
最左边的一列代表地址值,中间一列代表文本对应的 ASCII 字符,最右边的列就是我们的代码 。再在终端里执行 man ascii:
万字长文详解 Go 程序是怎样跑起来的?

文章插图
和 ASCII 字符表一对比,就能发现,中间的列和最右边的列是一一对应的 。也就是说,刚刚写完的 hello.go 文件都是由 ASCII 字符表示的,它被称为 文本文件,其他文件被称为 二进制文件 。
当然,更深入地看,计算机中的所有数据,像磁盘文件、网络中的数据其实都是一串比特位组成,取决于如何看待它 。在不同的情景下,一个相同的字节序列可能表示成一个整数、浮点数、字符串或者是机器指令 。
而像 hello.go 这个文件,8 个 bit,也就是一个字节看成一个单位(假定源程序的字符都是 ASCII 码),最终解释成人类能读懂的 Go 源码 。
Go 程序并不能直接运行,每条 Go 语句必须转化为一系列的低级机器语言指令,将这些指令打包到一起,并以二进制磁盘文件的形式存储起来,也就是可执行目标文件 。
从源文件到可执行目标文件的转化过程:
万字长文详解 Go 程序是怎样跑起来的?

文章插图
完成以上各个阶段的就是 Go 编译系统 。你肯定知道大名鼎鼎的 GCC(GNU Compile Collection),中文名为 GNU 编译器套装,它支持像 C,C++,JAVA,Python,Objective-C,Ada,Fortran,Pascal,能够为很多不同的机器生成机器码 。
可执行目标文件可以直接在机器上执行 。一般而言,先执行一些初始化的工作;找到 main 函数的入口,执行用户写的代码;执行完成后,main 函数退出;再执行一些收尾的工作,整个过程完毕 。
在接下来的文章里,我们将探索 编译和 运行的过程 。
2.编译链接概述
Go 源码里的编译器源码位于 src/cmd/compile 路径下,链接器源码位于 src/cmd/link 路径下 。
编译过程
我比较喜欢用 IDE(集成开发环境)来写代码, Go 源码用的 Goland,有时候直接点击 IDE 菜单栏里的“运行”按钮,程序就跑起来了 。这实际上隐含了编译和链接的过程,我们通常将编译和链接合并到一起的过程称为构建(Build) 。
编译过程就是对源文件进行词法分析、语法分析、语义分析、优化,最后生成汇编代码文件,以 .s 作为文件后缀 。
之后,汇编器会将汇编代码转变成机器可以执行的指令 。由于每一条汇编语句几乎都与一条机器指令相对应,所以只是一个简单的一一对应,比较简单,没有语法、语义分析,也没有优化这些步骤 。
编译器是将高级语言翻译成机器语言的一个工具,编译过程一般分为 6 步:扫描、语法分析、语义分析、源代码优化、代码生成、目标代码优化 。下图来自《程序员的自我


推荐阅读