面试官:请说一下如何优化结构体的性能?

简介: 面试官:请说一下如何优化结构体的性能?

使用内存对齐机制优化结构体性能,妙啊!

前言

之前分享过2篇结构体文章:10秒改struct性能直接提升15%,产品姐姐都夸我好棒Go语言空结构体这3种妙用,你知道吗? 得到了大家的好评。

这篇继续分享进阶内容:

结构体的定义,大家都很熟悉,想要定义出更节省内存空间的结构体,可不是一件简单的事。

我们必须掌握Go的结构体内存对齐机制,才能做出相应的优化:节省内存并提高性能。

先来看个例子

下面定义两个结构体,字段都一样,只是部分字段稍微调整了一下顺序。

但输出的结果却完全不同:一个顺序调整就节省了8个字节,太神奇了。

type BadSt struct {
  A int32
  B int64
  C bool
}
type GoodSt struct {
  A int32
  C bool
  B int64
}
func main() {
  bad := BadSt{A: 10, B: 20, C: false}
  fmt.Println(unsafe.Sizeof(bad))//输出结果:24
  good := GoodSt{A: 10, B: 20, C: false}
  fmt.Println(unsafe.Sizeof(good))//输出结果:16
}

为什么bad占用24字节,而good却只占用16字节呢

想要解开这个问题,我们得先来学习一下内存对齐机制,然后再来进一步分析。

原理讲解

基本概念

为了能让CPU可以更快的存储、读取到各个字段,Go编译器会帮我们把结构体做数据的对齐。

所谓的数据对齐,是指内存地址的大小是所存储数据大小的整数倍(按字节为单位),以便CPU可以一次将该数据从内存中读取出来,减少了读取次数。

编译器通过在结构体的各个字段之间填充一些空白,来达到对齐的目的

CPU访问内存

CPU 访问内存时,并不是逐个字节访问,而是以机器字(word)为单位进行访问

比如 64位CPU的字长(word size)为8bytes,那么CPU访问内存的单位也是8字节,每次加载的内存数据也是固定的若干字长,如8words(64bytes)、16words(128bytes)等

对齐系数

不同硬件平台占用的大小和对齐值都可能是不一样的,每个特定平台上的编译器都有自己的默认"对齐系数",32位系统对齐系数是4,64位系统对齐系数是8

不同类型的对齐系数也可能不一样,使用Go语言中的unsafe.Alignof函数可以返回相应类型的对齐系数,对齐系数都符合2^n这个规律,最大也不会超过8

func main() {
  fmt.Printf("bool:   %d\n", unsafe.Alignof(bool(true)))
  fmt.Printf("string: %d\n", unsafe.Alignof(string("a")))
  fmt.Printf("int:    %d\n", unsafe.Alignof(int(0)))
  fmt.Printf("int32:  %d\n", unsafe.Alignof(int32(0)))
  fmt.Printf("int64:  %d\n", unsafe.Alignof(int64(0)))
  fmt.Printf("float64:  %d\n", unsafe.Alignof(float64(0)))
  fmt.Printf("float32:%d\n", unsafe.Alignof(float32(0)))
}
//输出结果:
//bool:   1
//string: 8
//int:    8
//int32:  4
//int64:  8
//float64:8
//float32:4

对齐原则

  1. 结构体变量中成员的偏移量必须是成员大小的整数倍
  2. 整个结构体的内存大小必须是最大字节的整数倍(结构体的内存占用是1/4/8/16byte…)

案例分析

type BadSt struct {
  A int32
  B int64
  C bool
}

BadSt结构体,占用24个字节

image.png

分析过程:

  1. 字段A 4字节:先计算偏移量,最开头下标为0,0%4=0,正好整除,先占用4个字节;
  2. 字段B 8字节:下标4-7,对8都不能整除,则填充空白,下标8可以整除,所以下标8-15 8个字节为字段B的存储使用;
  3. 字段C 1字节:下标16,对1可以整除,所以下标16则用作字段C的存储;
  4. 最后,该结构体字段最大字节为8且目前已占用17字节,要保证是整数倍,所以最后面需要填充7个字节,占满24字节,才能满足条件(对齐原则2)。

image.png


type GoodSt struct {
  A int32
  C bool
  B int64
}

分析过程:

  1. 字段A 4字节:先计算偏移量,最开头下标为0,0%4=0,正好整除,先占用4个字节;
  2. 字段C 1字节:下标4,对1可以整除,所以下标4则用作字段C的存储;
  3. 字段B 8字节:下标5-7,对8都不能整除,则填充空白,下标8可以整除,所以下标8-15 8个字节为字段B的存储使用;
  4. 最后,该结构体字段最大字节为8且目前已占用16字节,正好是整数倍,所以后面不再需要填充空白了。

总结

通过上文的原理讲解和案例分析,我们发现内存对齐机制并不复杂。

可以简单理解为:将对齐系数小的字段,尽可能放在一起,尽量减少空白填充。

掌握了内存对齐机制后,结构体Struct的优化,调整下字段顺序,效果立竿见影。内存对齐其实就是典型的空间换时间的方式,来达到优化的目的。牢记对齐原则,对实际场景进行分析,减少空白填充

原文链接:mp.weixin.qq.com/s/64eWxeB0x…

相关文章
|
3月前
|
存储 缓存 编解码
Android经典面试题之图片Bitmap怎么做优化
本文介绍了图片相关的内存优化方法,包括分辨率适配、图片压缩与缓存。文中详细讲解了如何根据不同分辨率放置图片资源,避免图片拉伸变形;并通过示例代码展示了使用`BitmapFactory.Options`进行图片压缩的具体步骤。此外,还介绍了Glide等第三方库如何利用LRU算法实现高效图片缓存。
68 20
Android经典面试题之图片Bitmap怎么做优化
|
3月前
|
设计模式 Java 关系型数据库
【Java笔记+踩坑汇总】Java基础+JavaWeb+SSM+SpringBoot+SpringCloud+瑞吉外卖/谷粒商城/学成在线+设计模式+面试题汇总+性能调优/架构设计+源码解析
本文是“Java学习路线”专栏的导航文章,目标是为Java初学者和初中高级工程师提供一套完整的Java学习路线。
444 37
|
3月前
|
SQL 关系型数据库 MySQL
面试官:limit 100w,10为什么慢?如何优化?
面试官:limit 100w,10为什么慢?如何优化?
220 2
面试官:limit 100w,10为什么慢?如何优化?
|
4月前
|
缓存 NoSQL Redis
一天五道Java面试题----第九天(简述MySQL中索引类型对数据库的性能的影响--------->缓存雪崩、缓存穿透、缓存击穿)
这篇文章是关于Java面试中可能会遇到的五个问题,包括MySQL索引类型及其对数据库性能的影响、Redis的RDB和AOF持久化机制、Redis的过期键删除策略、Redis的单线程模型为何高效,以及缓存雪崩、缓存穿透和缓存击穿的概念及其解决方案。
|
4月前
|
存储 前端开发 JavaScript
面试时让你手写一个防抖和节流优化,你能写出来吗?(二)
面试时让你手写一个防抖和节流优化,你能写出来吗?(二)
|
5月前
|
存储 负载均衡 关系型数据库
面试题MySQL问题之通过配置FastDFS提高性能如何解决
面试题MySQL问题之通过配置FastDFS提高性能如何解决
55 1
|
5月前
|
缓存 Prometheus 监控
Java面试题:如何监控和优化JVM的内存使用?详细讲解内存调优的几种方法
Java面试题:如何监控和优化JVM的内存使用?详细讲解内存调优的几种方法
97 3
|
4月前
|
运维 监控 算法
[go 面试] 优化线上故障排查与性能问题的方法
[go 面试] 优化线上故障排查与性能问题的方法
|
5月前
|
缓存 监控 算法
Java面试题:讨论JVM性能调优的常见方法和技巧。
Java面试题:讨论JVM性能调优的常见方法和技巧。
59 1
|
5月前
|
Java
Java面试题:什么是G1垃圾收集器,它如何改善性能?
Java面试题:什么是G1垃圾收集器,它如何改善性能?
55 0