1 runtime机制
Go语言的runtime库提供了一系列底层功能,支持高效的并发执行和内存管理。其中Goroutines是轻量级线程,具有小栈和自动调整大小的特性,通过MPG调度模型在多个线程上运行。
内存管理涉及堆栈分配和逃逸分析,垃圾回收采用并发标记-清除算法,分代收集优化效率。Channels提供同步机制,Select进行多路复用。
以下是对Go语言runtime库中两个关键功能——Goroutines和GC垃圾回收机制的深入解析。
2. Goroutines
- Goroutine简介
Goroutine是Go语言的一种轻量级线程,支持大规模并发执行。Goroutine的创建和调度开销远小于传统操作系统线程。
- Goroutine的实现
初始栈大小:每个Goroutine的初始栈大小约为2KB,且会根据需要自动增长和收缩。
调度模型:Go采用MPG调度模型,即多个Goroutine映射到多个操作系统线程上。
调度器(Scheduler)结构:
G:代表一个Goroutine,包含Goroutine的栈和程序计数器等信息。
M:代表一个操作系统线程,用于执行Goroutine。
P:代表逻辑处理器,管理Goroutine队列。
调度器的主要任务是将G分配给M执行,P的数量可以通过GOMAXPROCS环境变量设置。
从图表上讲,我们可以将调度程序表示为:
M
|
P -- G
| |
G G
|
G
在单核情况下,所有 Goroutine运行在同一个线程, M0中,每一个线程维护一个上下文 Content, P任何时刻,一个上下文只有一个 Goroutine,其他Goroutine在运行时 队列queue等待。
一个Goroutine 运行完成自己的时间片后,让出上下文,自己回到运行队列
当正在运行的GO阻塞时,可以IO,将再创建一个线程 M1,P转到新的线程中运行
M0 M1 syscall
| | MQ
P —— G P - G |
| | | Go
Go G G
| |
G G
当M0 返回时,它会尝试从其他线程中 偷一个上下文,
如果没有获取到,将把 Goroutine 放到 Global 运行队列中。
然后把自己放入线程缓冲。
3 内存管理
- 内存分配
堆和栈:Go程序中的变量可以分配在栈或堆上。栈上分配的变量在函数返回时自动释放,堆上分配的变量需要通过垃圾回收器回收。
逃逸分析:编译器在编译时进行逃逸分析,确定变量是否需要分配到堆上。逃逸到堆上的变量生命周期更长,但会增加GC负担。
4 垃圾回收(GC)
- 并发标记-清除算法
三色标记法:对象分为白色(未访问)、灰色(已访问但未处理完)、黑色(已处理完)。
GC线程从根对象开始标记,将对象从白色变为灰色,再变为黑色。
写屏障(Write Barrier):在标记阶段,写屏障确保新创建或引用的对象被正确标记,以维持标记的准确性。
- GC阶段
标记开始(Mark Start):暂停所有Goroutine,标记根对象。
并发标记(Concurrent Marking):并发标记对象,允许程序继续执行。
标记终止(Mark Termination):再次暂停所有Goroutine,完成标记过程。
清除阶段(Sweep):回收未标记的对象内存。
分代收集
分代思想:虽然Go主要采用并发标记-清除算法,但引入了分代思想,优先回收生命周期较短的对象,提高GC效率。Go根据对象大小 将对象分为3类
微小对象 Tiny size <16B
使用mcache的微小分配器分配大小小于 16个字节的对象,在单个16字节块上可以完成多个微小分配
小对象 16B ~32KB
大小在16个字节和32k字节之间的对象被分配在G运行所在的P ncache对应 mspan size class
在微小型和小型 对象种秒如果mspan列表为空,分配器将从 mheap获取大量页面用于mspan
如果mheap为空或 没有足够大的页面满足分配请求,那么它将从操作系统分配一组新的页 至少 1MB
- 大对象
大小 >32KB, 大于 32KB 的对象直接分配在 mheap的相应大小类上 size class
如果 mheap为空或 没有足够大的页面满足分配请求,则它将从操作系统分配一组新的页 至少 1MB
如果遇到内存不足的问题 out of memory,不当的内存管理也可能导致内存泄露
GC内存管理堆内存,简单说,它释放了孤儿对象 orphan object 使用的内存,所谓孤儿对象是指那些不再被栈 直接或间接引用的对象。
从GO1.12版本开始,Go使用非分代,并发的,基于三色标记和清理的垃圾回收器。
5. 并发原语
- Channels
同步机制:Channels用于Goroutine之间的通信和同步,通过make函数创建。可以指定缓冲区大小,支持无缓冲和有缓冲两种模式。
操作:chan <- value发送数据,<- chan接收数据。支持select语句进行多路复用。
- Select语句
多路复用:select语句允许在多个channel操作中进行选择,第一个准备好的操作会被执行,常用于处理多路通信。
6. 其他runtime功能
- 定时器
time包:提供定时器功能,通过time.NewTimer和time.NewTicker创建定时器,定时器触发时向channel发送信号。
- Panic和Recover
错误处理:panic用于引发异常,recover用于捕获异常,防止程序崩溃。
反射(Reflection)
反射机制:通过reflect包提供反射能力,允许在运行时检查和操作对象的类型和值。
7. 性能优化
- runtime可以用于编译器优化
内联展开:编译器将小函数内联到调用处,减少函数调用开销。
逃逸分析:编译器分析变量的作用域,决定变量是分配在栈上还是堆上。