Go的slice扩容不是全部都按照1.25扩容的,还有内存对齐的概念,别再被忽悠了

简介: Go的slice扩容不是全部都按照1.25扩容的,还有内存对齐的概念,别再被忽悠了

Go的slice扩容机制



扩容


说实话,我看到别的文章中说slice的扩容很简单,小于1024,按照两倍去扩容;大于等于1024,按照1.25去扩容;像这样不负责任的文章误导初学者使我非常不爽,今天就给大家带来源码级别的slice扩容机制,别怕,一切都是那么简单。


1. 先看一个例子(<1024)


package main
import "fmt"
func main() {
 s1 := make([]int, 1023)
 s2 := make([]int, 1)
 s1 = append(s1, s2...)
 fmt.Println(cap(s1), len(s1))
}
输出结果是:
2048 1024
从结果可以看出,小于1024的确实按照2倍去扩容的,我们不妨计作:
f(x) = 2x (x<1024)


大家知道为什么是1024吗?有人问过go作者,说为啥不是2048啊之类的,你猜作者怎么回答,非常简单的一句话:因为在计算机世界中1024这个数字很特别,它就是一个数字,是一个以2为底,10为指数的数,就这样简单。所以有时候大家看源码别纠结细节,一旦陷入就要请求旁边的高人将自己解救出来呀。


2. 再看一个例子(>=1024)


package main
import "fmt"
func main() {
 s1 := make([]int, 1024)
 s2 := make([]int, 258)
 s1 = append(s1, s2...)
 fmt.Println(cap(s1), len(s1))
}
输出结果是:
1696 1282
从结果可以看出,大于等于1024,不是按照1.25(1+1/4)的倍速增长的,所以:
f(x) = x + x/4 (x>=1024)就突然不成立了,这到底是为什么?是不是想要一探究尽呢?接下来剖析源码就知道啦。


3. 两个函数


f(x) = 2x (x<1024)
f(x) = x + x/4 (x >= 1024)


确认:函数1成立,函数2在有些条件下成立 嗯?为什么在有些条件下成立呢?再看一个例子:


package main
import "fmt"
func main() {
 s1 := make([]int, 1024)
 s2 := make([]int, 1)
 s1 = append(s1, s2...)
 fmt.Println(cap(s1), len(s1))
}
输出结果是:
1280 1025

我们可以带函数2去计算下:f(1024) = 1024 + 1024/4 = 1024 + 256 = 1280你看这样的就可以满足函数2了,接下来分析下上面不满足函数2的例子。


4. 源码剖析不满足1.25增速的原因


在源码中主要是看growslice这个函数。


func growslice(et *_type, old slice, cap int) slice {
 ...
 ...
 ... //省略前面无关紧要的代码
 newcap := old.cap
 doublecap := newcap + newcap
 if cap > doublecap {
  newcap = cap
 } else {
  if old.len < 1024 { //小于1024 double就可以
   newcap = doublecap
  } else {
   for 0 < newcap && newcap < cap { // 容量比之前大,那么按照1.25的倍速增长
    newcap += newcap / 4
   }
  }
 }
 ... //省略部分代码
 var lenmem, newlenmem, capmem uintptr
 switch {
 ... //省略
 case et.size == sys.PtrSize:
  lenmem = uintptr(old.len) * sys.PtrSize
  newlenmem = uintptr(cap) * sys.PtrSize
  // 看这里 核心函数roundupsize 按照内存字节对齐
  capmem = roundupsize(uintptr(newcap) * sys.PtrSize)
  overflow = uintptr(newcap) > maxAlloc/sys.PtrSize
  newcap = int(capmem / sys.PtrSize) //1696
 ...//省略部分代码
 }
}


好了按照代码流程先走一遍:

  1. 首先我们的长度是大于等于1024的,那么按照上面逻辑先计算得出:f(1024)=1280,发现其实空间还不够,那么继续扩容f(1280)=1280+1280/4=1600
  2. 紧接着进入switch case中,这里的sys.PtrSize=8,而我们的et.size因为是int存储所以也是8,刚好命中这个case,进入。
  3. 然后计算新元素capmem=roundupsize(uintptr(newcap) * sys.PtrSize),则capmem=roundupsize(1600*8)=roundupsize(12800)。
  4. roundupsize函数中size=12800<_MaxSmallSize(32768),并且size<=smallSizeMax(1024)-8不满足,所以最终进入else代码段。
func roundupsize(size uintptr) uintptr {
 if size < _MaxSmallSize {
  if size <= smallSizeMax-8 {
   return uintptr(class_to_size[size_to_class8[divRoundUp(size, smallSizeDiv)]])
  } else {
   // 进入到这里
   return uintptr(class_to_size[size_to_class128[divRoundUp(size-smallSizeMax, largeSizeDiv)]])
  }
 }
 if size+_PageSize < size {
  return size
 }
 return alignUp(size, _PageSize)
}
// divRoundUp returns ceil(n / a).
func divRoundUp(n, a uintptr) uintptr {
 // a is generally a power of two. This will get inlined and
 // the compiler will optimize the division.
 return (n + a - 1) / a
}
  1. 看下class_to_size和size_to_class128
const (
 _MaxSmallSize   = 32768
 smallSizeDiv    = 8
 smallSizeMax    = 1024
 largeSizeDiv    = 128
 _NumSizeClasses = 67
 _PageShift      = 13
)
var class_to_size = [_NumSizeClasses]uint16{
0, 8, 16, 24, 32, 48, 64, 80, 96, 112, 
128, 144, 160, 176, 192, 208, 224, 240, 
256, 288, 320, 352, 384, 416, 448, 480, 
512, 576, 640, 704, 768, 896, 1024, 1152, 
1280, 1408, 1536, 1792, 2048, 2304, 2688, 
3072, 3200, 3456, 4096, 4864, 5376, 6144, 
6528, 6784, 6912, 8192, 9472, 9728, 10240, 
10880, 12288, 13568, 14336, 16384, 18432, 
19072, 20480, 21760, 24576, 27264, 28672, 32768}
var size_to_class128 = [(_MaxSmallSize-smallSizeMax)/largeSizeDiv + 1]uint8{
32, 33, 34, 35, 36, 37, 37, 38, 38, 
39, 39, 40, 40, 40, 41, 41, 41, 42, 
43, 43, 44, 44, 44, 44, 44, 45, 45, 
45, 45, 45, 45, 46, 46, 46, 46, 47, 
47, 47, 47, 47, 47, 48, 48, 48, 49, 
49, 50, 51, 51, 51, 51, 51, 51, 51, 
51, 51, 51, 52, 52, 52, 52, 52, 52, 
52, 52, 52, 52, 53, 53, 54, 54, 54, 
54, 55, 55, 55, 55, 55, 56, 56, 56, 
56, 56, 56, 56, 56, 56, 56, 56, 57, 
57, 57, 57, 57, 57, 57, 57, 57, 57, 
58, 58, 58, 58, 58, 58, 59, 59, 59, 
59, 59, 59, 59, 59, 59, 59, 59, 59, 
59, 59, 59, 59, 60, 60, 60, 60, 60, 
60, 60, 60, 60, 60, 60, 60, 60, 60, 
60, 60, 61, 61, 61, 61, 61, 62, 62, 
62, 62, 62, 62, 62, 62, 62, 62, 62, 
63, 63, 63, 63, 63, 63, 63, 63, 63, 
63, 64, 64, 64, 64, 64, 64, 64, 64, 
64, 64, 64, 64, 64, 64, 64, 64, 64, 
64, 64, 64, 64, 64, 65, 65, 65, 65, 
65, 65, 65, 65, 65, 65, 65, 65, 65, 
65, 65, 65, 65, 65, 65, 65, 65, 66, 
66, 66, 66, 66, 66, 66, 66, 66, 66, 
66, 67, 67, 67, 67, 67, 67, 67, 67, 
67, 67, 67, 67, 67, 67, 67, 67, 67, 
67, 67, 67, 67, 67, 67, 67, 67, 67, 
67, 67, 67, 67, 67, 67}
  1. 通过函数divRoundUp(size-smallSizeMax, largeSizeDiv)计算出:divRoundUp(12800-1024, 128) = divRoundUp(12800-1024, 128) = (12800-1024+128-1) / 128 = 11903/128=92
  2. 我们根据92在size_to_class128中找到是57,然后在class_to_size中根据索引57找到是13568。
  3. 所以roundupsize函数返回13568,而newcap = int(capmem / sys.PtrSize) = 13568/8 = 1696,至此我们就求出来cap的最终容量是1696啦。
  4. 注意我的go源码版本是go1.16.7


5. 小结


看完源码之后心情舒爽,我相信大家肯定会更自信了,不管同事问你还是面试官问你,你可以自豪的给他从源码角度分析了,而且别人一听就能判断出你是读过源码的,求知欲满满!

如果你觉得这篇文章对你帮助很大,请你转发、分享、关注、点赞哦,写作不易,还望大家多多支持哈。



相关文章
|
3月前
|
Go 调度 开发者
[go 面试] 深入理解进程、线程和协程的概念及区别
[go 面试] 深入理解进程、线程和协程的概念及区别
|
21天前
|
Java 编译器 测试技术
go语言避免不必要的内存分配
【10月更文挑战第18天】
27 1
|
22天前
|
存储 算法 Java
Go语言的内存管理机制
【10月更文挑战第25天】Go语言的内存管理机制
22 2
|
3月前
|
存储 安全 编译器
Go 内存分布
该文章深入分析了Go语言中值的内存分布方式,特别是那些分布在多个内存块上的类型,如切片、映射、通道、函数、接口和字符串,并讨论了这些类型的内部结构和赋值时的行为,同时指出了“引用类型”这一术语在Go中的使用可能会引起的误解。
53 5
Go 内存分布
|
2月前
|
监控 算法 Java
深入理解Java中的垃圾回收机制在Java编程中,垃圾回收(Garbage Collection, GC)是一个核心概念,它自动管理内存,帮助开发者避免内存泄漏和溢出问题。本文将探讨Java中的垃圾回收机制,包括其基本原理、不同类型的垃圾收集器以及如何调优垃圾回收性能。通过深入浅出的方式,让读者对Java的垃圾回收有一个全面的认识。
本文详细介绍了Java中的垃圾回收机制,从基本原理到不同类型垃圾收集器的工作原理,再到实际调优策略。通过通俗易懂的语言和条理清晰的解释,帮助读者更好地理解和应用Java的垃圾回收技术,从而编写出更高效、稳定的Java应用程序。
|
3月前
|
存储 程序员 C++
内存管理概念 (二)
内存管理概念 (二)
58 1
|
3月前
|
人工智能 Go
go slice 扩容实现
go slice 扩容实现
52 3
|
3月前
|
人工智能 编译器 Go
go slice 基本用法
go slice 基本用法
52 1
|
3月前
|
存储 安全 Go
Go 中的指针:了解内存引用
Go 中的指针:了解内存引用
|
3月前
|
编译器 数据库连接 Go
Go Sync 包:并发的 6 个关键概念
Go Sync 包:并发的 6 个关键概念