之前 Dave Cheney 已经为我们讲解过了 Go 是如何用 go 编译自己的。这里,他继续给大家讲解一下 go build 命令是如何工作的(原文)。
————翻译分隔线————
go build 命令是如何工作的?
本文以 Go 的标准库为例,介绍了 Go 编译过程的工作原理。
gc 工具链
本文将关注 gc 工具链。gc 工具链的名字来自 Go 的前端编译器 cmd/gc,这主要是为了与 gccgo 工具链进行区分。当人们讨论 Go 编译器的时候,多半是指 gc 工具链。本文不关注 gccgo 工具链。
gc 工具链是直接从 Plan 9 的工具链剥离出来的。该工具链由一个 Go 编译器、一个 C 编译器、一个汇编器和一个链接器组成。可以在 Go 代码的 src/cmd/ 子目录找到这些工具,包括在所有实现下共用的前端,和在不同处理器架构下特定的后端。后端用特定的字母标识,这也是 Plan 9 的一个传统。命令包括:
5g、6g 和 8g 是 .go 文件的对应 arm、amd64 和 386 的编译器;
5c、6c 和 8c 是 .c 文件的对应 arm、amd64 和 386 的编译器;
5a、6a 和 8a 是 .s 文件的对应 arm、amd64 和 386 的编译器;
5l、6l 和 8l 是用于上面命令产生的文件的链接器,同样对应 arm、amd64 和 386。
需要注意的是,每个命令都可以在任何被支持的平台上进行编译,这也是 Go 的交叉编译能力的一种体现。你可以在这篇文章里了解到更多关于交叉编译的情况。
构建包
构建一个 Go 包至少包含两个步骤,编译 .go 文件,然后将编译结果打包。考虑到 crypto/hmac 很小,只有一个源文件和测试文件,所以用其举例说明。使用 -x 选项以告诉 go build 打印出它所执行的每一步
% go build -x crypto/hmac WORK=/tmp/go-build249279931 mkdir -p $WORK/crypto/hmac/_obj/ mkdir -p $WORK/crypto/ cd /home/dfc/go/src/pkg/crypto/hmac /home/dfc/go/pkg/tool/linux_arm/5g -o $WORK/crypto/hmac/_obj/_go_.5 -p crypto/hmac -complete -D _/home/dfc/go/src/pkg/crypto/hmac -I $WORK ./hmac.go /home/dfc/go/pkg/tool/linux_arm/pack grcP $WORK $WORK/crypto/hmac.a $WORK/crypto/hmac/_obj/_go_.5
逐一了解这些步骤
WORK=/tmp/go-build249279931 mkdir -p $WORK/crypto/hmac/_obj/ mkdir -p $WORK/crypto/
go build 创建了一个临时目录 /tmp/go-build249279931 并且填充一些框架性的子目录用于保存编译的结果。第二个 mkdir 可能是多余的,已经创建了 issue 6538 来跟踪这个问题。
cd /home/dfc/go/src/pkg/crypto/hmac /home/dfc/go/pkg/tool/linux_arm/5g -o $WORK/crypto/hmac/_obj/_go_.5 -p crypto/hmac -complete -D _/home/dfc/go/src/pkg/crypto/hmac -I $WORK ./hmac.go
go 工具切换 crypto/hmac 的源代码目录,并且调用架构对应的 go 编译器,在本例中是 5g。实际上是没有 cd 的,当 5g 执行时 /home/dfc/go/src/pkg/crypto/hmac 作为 exec.Command.Dir 的参数传递。这意味着为了让命令行更加精简,.go 源文件可以使用对应其源代码目录的相对路径。
编译器生成唯一的一个临时文件 $WORK/crypto/hmac/_obj/_go_.5 将在最后一步中使用。
/home/dfc/go/pkg/tool/linux_arm/pack grcP $WORK $WORK/crypto/hmac.a $WORK/crypto/hmac/_obj/_go_.5
最后一步是打包目标文件到将被链接器和编译器使用的归档文件 .a 中。
由于在包上调用了 go build ,$WORK 中的结果将在编译结束后删除。如果调用 go install -x 将会输出额外的两行
mkdir -p /home/dfc/go/pkg/linux_arm/crypto/ cp $WORK/crypto/hmac.a /home/dfc/go/pkg/linux_arm/crypto/hmac.a
这演示了 go build 与 install 的不同之处; build 构建,install 构建并且安装,以便用于其他构建。
构建更加复杂的包
你可能正在思考前面例子中的打包步骤。这里的编译器和链接器仅接受了单一的文件作为包的内容,如果包含多个目标文件,在使用它们之前,必须将其打包到一个单一的 .a 归档文件中。
cgo 是一个常见的产生超过一个中间目标文件的例子,不过它对于本文来说太过复杂了,这里用包含 .s 汇编文件的情况作为替代的例子,例如 crypto/md5。
% go build -x crypto/md5 WORK=/tmp/go-build870993883 mkdir -p $WORK/crypto/md5/_obj/ mkdir -p $WORK/crypto/ cd /home/dfc/go/src/pkg/crypto/md5 /home/dfc/go/pkg/tool/linux_amd64/6g -o $WORK/crypto/md5/_obj/_go_.6 -p crypto/md5 -D _/home/dfc/go/src/pkg/crypto/md5 -I $WORK ./md5.go ./md5block_decl.go /home/dfc/go/pkg/tool/linux_amd64/6a -I $WORK/crypto/md5/_obj/ -o $WORK/crypto/md5/_obj/md5block_amd64.6 -D GOOS_linux -D GOARCH_amd64 ./md5block_amd64.s /home/dfc/go/pkg/tool/linux_amd64/pack grcP $WORK $WORK/crypto/md5.a $WORK/crypto/md5/_obj/_go_.6 $WORK/crypto/md5/_obj/md5block_amd64.6
这个例子执行在 linux/amd64 主机上,6g 被调用以编译两个 .go 文件:md5.go 和 md5block_decl.go。后面这个包含一些用汇编实现的函数的声明。
这时 6a 被调用以汇编 md5block_amd64.s。选择哪个 .s 来编译的逻辑在我之前的关于条件编译的文章中进行了说明。
最后调用 pack 来打包 Go 的目标文件 _go_.6,以及汇编目标文件 md5block_amd64.6 到单一的一个归档文件中。
构建命令
一个 Go 命令是一个命名为 main 的包。main 包,或者说命令的编译方式与其他包一致,不过它们会在内部经过一些额外的步骤来链接成最终的可执行文件。让我们通过 cmd/gofmt 来研究一下这个过程
% go build -x cmd/gofmt WORK=/tmp/go-build979246884 mkdir -p $WORK/cmd/gofmt/_obj/ mkdir -p $WORK/cmd/gofmt/_obj/exe/ cd /home/dfc/go/src/cmd/gofmt /home/dfc/go/pkg/tool/linux_amd64/6g -o $WORK/cmd/gofmt/_obj/_go_.6 -p cmd/gofmt -complete -D _/home/dfc/go/src/cmd/gofmt -I $WORK ./doc.go ./gofmt.go ./rewrite.go ./simplify.go /home/dfc/go/pkg/tool/linux_amd64/pack grcP $WORK $WORK/cmd/gofmt.a $WORK/cmd/gofmt/_obj/_go_.6 cd . /home/dfc/go/pkg/tool/linux_amd64/6l -o $WORK/cmd/gofmt/_obj/exe/a.out -L $WORK $WORK/cmd/gofmt.a cp $WORK/cmd/gofmt/_obj/exe/a.out gofmt
前面的六行应该已经熟悉了,main 包会向其他 Go 包一样编译和打包。
不同之处在于倒数第二行,调用链接器生成二进制的可执行文件。
/home/dfc/go/pkg/tool/linux_amd64/6l -o $WORK/cmd/gofmt/_obj/exe/a.out -L $WORK $WORK/cmd/gofmt.a
最后一行复制并重命名编译后的二进制文件到其最终的位置和名称。如果使用了 go install,二进制也会被复制到 $GOPATH/bin(如果设置了 $GOBIN,则为 $GOBIN)。
历史原因
如果你回到足够久远的时代,回到 go tool 之前,回到 Makefiles 的时代,你可以找到 Go 编译过程的核心。这个例子来自 release.r60 的文档
$ cat >hello.go <<EOF package main import "fmt" func main() { fmt.Printf("hello, world\n") } EOF $ 6g hello.go $ 6l hello.6 $ ./6.out hello, world
也就是这些,6g 编译了 .go 文件到 .6 目标文件,6l 链接目标文件以及 fmt (和运行时)包来生成二进制文件 6.out。
结束语
在本文中,我们讨论了 go build 的工作原理,并了解了 go install 对编译结果处理的不同方式。
现在你已经知道 go build 是如何工作的了,以及如何通过 -x 展示编译过程,可以尝试传递这个标识到 go test 并且观察其结果。
另外,如果已经在系统中安装了 gccgo,可以向 go build 传递 -compiler gccgo,然后使用 -x 来了解 Go 代码是如何用这个编译器进行编译的。
Leave a comment