速通Go语言编译过程

简介: Go语言编译过程详解:从词法分析(生成token)到句法分析(构建语法树),再到语义分析(类型检查、推断、匹配及函数内联)、生成中间码(SSA)和汇编码。最后,通过链接生成可执行文件。作者sharkchili,CSDN Java博客专家,分享技术细节,邀请读者加入交流群。

写在文章开头

写了这么久的Go语言,慢慢也有了一些读者的关注,但是大部分读者都还是Java(笑),而笔者今天准备分享的,则是关于Go语言的编译过程。

Hi,我是 sharkChili ,是个不断在硬核技术上作死的 java coder ,是 CSDN的博客专家 ,也是开源项目 Java Guide 的维护者之一,熟悉 Java 也会一点 Go ,偶尔也会在 C源码 边缘徘徊。写过很多有意思的技术博客,也还在研究并输出技术的路上,希望我的文章对你有帮助,非常欢迎你关注我的公众号: 写代码的SharkChili

因为近期收到很多读者的私信,所以也专门创建了一个交流群,感兴趣的读者可以通过上方的公众号获取笔者的联系方式完成好友添加,点击备注 “加群” 即可和笔者和笔者的朋友们进行深入交流。

Go语言编译过程详解

词法分析

假设我们此时用goland写下面这样基础代码:

package main

import "fmt"



func main() {
   
    fmt.Println("hello Go")
}

编译时首先会经过词法分析,词法分析主要做的就是将代码中的最小语义生成token,而笔者这里所说的最小语义,读者完全可以理解为上述的每一个关键字,例如packageimport 等。

句法分析

完成词法分析之后就是句法分析了,它会基于上述的token序列生成语法树,大体如下这段笔者的示例图所示:

语义分析

完成了词句的分析之后,就是语义分析了,通过语义了解代码的作用,这一步会涉及代码的各种检查和优化,例如:

  1. 类型检查:因为go也是和Javac#一样是一门强类型语言,所以编译时会对类型进行检查,再编译时检查当代码中的类型是否安全。
  2. 类型推断:go语言通过字面量初始化是无需声明类型的,其语法如 i:=2,所以在语义分析阶段,go语言也会针对这些代码段进行语义分析。
  3. 类型是否匹配
  4. 函数内联:对于某些函数,Go语言会在编译期对当函数的调用出进行内联优化,从而避免函数调用的堆栈调用的开销,可能笔者这里说的有点拗口,举个例子,假如我们写了一个add函数其功能和调用代码如下:
func main() {
   
    sum := add(1, 2)
    fmt.Println(sum)
}

func add(num1 int, num2 int) int {
   
    return num1 + num2
}

go在进行语义分析时,通过函数内联,可能会将其优化成下面这样:

func main() {
   
    sum := 1+2
    fmt.Println(sum)
}
  1. 逃逸分析:关于逃逸分析笔者会在后续的文章中展开说明,这里简单了解一下逃逸分析则是判断当前函数内的对象是否被外部引用,由此推断其是否发生逃逸,从而决定当前这个对象示例是分配在堆上还是栈上。

生成中间码

在生成各个系统平台可执行的机器码之前,go会生成一段与平台无关的中间汇编码,即可SSA码,在此期间,代码可能还会再进行一次优化工作。

对于SSA码,感兴趣的读者可以在操作系统上通过这段指令生成:

GOSSAFUNC=main go build main.go

执行完成之后,文件夹会生成一段ssa.html,读者打开之后就会看到下面这样一个网页,其中网页的最右边就是我们说的SSA码,由于SSA码不是笔者本次讨论的重点就是就不做展开了:

生成汇编码

通过上述的步骤之后,系统就会得到中间码,自此各个平台都会基于这段中间码生成汇编码,当然如果你对汇编码感兴趣,可以通过下面这段执行看到我们的代码转为Plan 9的汇编码:

go build -gcflags -S main.go

可以看到一行简单的输出语句就变成下面这样一段汇编代码:

链接

基于上述的代码键入如下指令即可查看go语言的编译过程:

go build -n main.go

此时在Linux终端就会输出一大段日志,这里笔者就贴出几个比较核心的地方,首先就是导入配置,由上代码我们可知我们用到了go语言最基本的runtimefmt包:

# import config
packagefile fmt=/root/.cache/go-build/7a/7a84f8c71e0cd98a53158ab655d48960d612698abe0567abbeb7a633bcb066b7-d
packagefile runtime=/root/.cache/go-build/e2/e2bf522ce6c0c2bfb09b8486578b70b1424422349a8dc2c5e200bf6b8760d950-d
EOF

随后就开始通过compile完成上述所说的编译过程:

cd /root
/usr/local/go/pkg/tool/linux_amd64/compile -o $WORK/b001/_pkg_.a -trimpath "$WORK/b001=>" -p main -complete -buildid 5LGDePcnhcnEtpXVckY4/5LGDePcnhcnEtpXVckY4 -goversion go1.22.0 -c=2 -nolocalimports -importcfg $WORK/b001/importcfg -pack ./main.go
/usr/local/go/pkg/tool/linux_amd64/buildid -w $WORK/b001/_pkg_.a # internal
cat >$WORK/b001/importcfg.link << 'EOF' # internal

.....

中间完成中间码和汇编码生成机器码之后,就来到了链接这一步,如下输出所示,可以看到它用到了/usr/local/go/pkg/tool/linux_amd64/link

cd .
/usr/local/go/pkg/tool/linux_amd64/link -o $WORK/b001/exe/a.out -importcfg $WORK/b001/importcfg.link -buildmode=exe -buildid=IGC7T6g3raqmSVvDtHEN/5LGDePcnhcnEtpXVckY4/5LGDePcnhcnEtpXVckY4/IGC7T6g3raqmSVvDtHEN -extld=gcc $WORK/b001/_pkg_.a
/usr/local/go/pkg/tool/linux_amd64/buildid -w $WORK/b001/exe/a.out # internal

最终在最后一段输出我们得到了可执行文件main,自此我们的go代码编译过程完成:

mv $WORK/b001/exe/a.out main

小结

我们再简单的小结一下这篇文章的内容,本文给出了一段比较简单的go语言示例代码,通过go工具包所提供的各种指令解释并查看了以下几个步骤的详细工作过程,关于Go语言的编译过程,其整体步骤为:

  1. 词法分析
  2. 句法分析
  3. 语义分析
  4. 生成中间码
  5. 生成机器码
  6. 链接构成可执行文件

我是 sharkchiliCSDN Java 领域博客专家开源项目—JavaGuide contributor,我想写一些有意思的东西,希望对你有帮助,如果你想实时收到我写的硬核的文章也欢迎你关注我的公众号: 写代码的SharkChili
因为近期收到很多读者的私信,所以也专门创建了一个交流群,感兴趣的读者可以通过上方的公众号获取笔者的联系方式完成好友添加,点击备注 “加群” 即可和笔者和笔者的朋友们进行深入交流。

参考

Go 语言设计与实现 :https://draveness.me/golang/

目录
相关文章
|
4月前
|
编译器 Go
揭秘 Go 语言中空结构体的强大用法
Go 语言中的空结构体 `struct{}` 不包含任何字段,不占用内存空间。它在实际编程中有多种典型用法:1) 结合 map 实现集合(set)类型;2) 与 channel 搭配用于信号通知;3) 申请超大容量的 Slice 和 Array 以节省内存;4) 作为接口实现时明确表示不关注值。此外,需要注意的是,空结构体作为字段时可能会因内存对齐原因占用额外空间。建议将空结构体放在外层结构体的第一个字段以优化内存使用。
|
4月前
|
运维 监控 算法
监控局域网其他电脑:Go 语言迪杰斯特拉算法的高效应用
在信息化时代,监控局域网成为网络管理与安全防护的关键需求。本文探讨了迪杰斯特拉(Dijkstra)算法在监控局域网中的应用,通过计算最短路径优化数据传输和故障检测。文中提供了使用Go语言实现的代码例程,展示了如何高效地进行网络监控,确保局域网的稳定运行和数据安全。迪杰斯特拉算法能减少传输延迟和带宽消耗,及时发现并处理网络故障,适用于复杂网络环境下的管理和维护。
|
24天前
|
分布式计算 Go C++
初探Go语言RPC编程手法
总的来说,Go语言的RPC编程是一种强大的工具,让分布式计算变得简单如同本地计算。如果你还没有试过,不妨挑战一下这个新的编程领域,你可能会发现新的世界。
42 10
|
4月前
|
存储 缓存 监控
企业监控软件中 Go 语言哈希表算法的应用研究与分析
在数字化时代,企业监控软件对企业的稳定运营至关重要。哈希表(散列表)作为高效的数据结构,广泛应用于企业监控中,如设备状态管理、数据分类和缓存机制。Go 语言中的 map 实现了哈希表,能快速处理海量监控数据,确保实时准确反映设备状态,提升系统性能,助力企业实现智能化管理。
70 3
|
4月前
|
存储 缓存 安全
Go 语言中的 Sync.Map 详解:并发安全的 Map 实现
`sync.Map` 是 Go 语言中用于并发安全操作的 Map 实现,适用于读多写少的场景。它通过两个底层 Map(`read` 和 `dirty`)实现读写分离,提供高效的读性能。主要方法包括 `Store`、`Load`、`Delete` 等。在大量写入时性能可能下降,需谨慎选择使用场景。
|
4月前
|
SQL 安全 Java
阿里双十一背后的Go语言实践:百万QPS网关的设计与实现
解析阿里核心网关如何利用Go协程池、RingBuffer、零拷贝技术支撑亿级流量。 重点分享: ① 如何用gRPC拦截器实现熔断限流; ② Sync.Map在高并发读写中的取舍。
154 1
|
4月前
|
存储 算法 安全
基于 Go 语言的公司内网管理软件哈希表算法深度解析与研究
在数字化办公中,公司内网管理软件通过哈希表算法保障信息安全与高效管理。哈希表基于键值对存储和查找,如用户登录验证、设备信息管理和文件权限控制等场景,Go语言实现的哈希表能快速验证用户信息,提升管理效率,确保网络稳定运行。
65 0
|
6月前
|
开发框架 Go 计算机视觉
纯Go语言开发人脸检测、瞳孔/眼睛定位与面部特征检测插件-助力GoFly快速开发框架
开发纯go插件的原因是因为目前 Go 生态系统中几乎所有现有的人脸检测解决方案都是纯粹绑定到一些 C/C++ 库,如 OpenCV 或 dlib,但通过 cgo 调用 C 程序会引入巨大的延迟,并在性能方面产生显著的权衡。此外,在许多情况下,在各种平台上安装 OpenCV 是很麻烦的。使用纯Go开发的插件不仅在开发时方便,在项目部署和项目维护也能省很多时间精力。
162 5
|
7月前
|
Go 数据安全/隐私保护 开发者
Go语言开发
【10月更文挑战第26天】Go语言开发
93 3
|
7月前
|
Java 程序员 Go
Go语言的开发
【10月更文挑战第25天】Go语言的开发
86 3