Go语言核心手册-3.字典

简介: 对于map的使用,大家肯定都会,所以基础的知识讲解的不多,主要是对map的底层结构进行了详细的讲解,正所谓知其然,必知其所以然!对于map的底层结构设计,感觉有些意思,特别是对于它的hash方式(取前N位和后M位),再结合它的扩容和缩容,其实可以从中提炼一些共性的东西。然后对于Rehash,这个和Redis的Rehash原因一样,这块应该是业内的通用设计方法,感兴趣的同学可以看看redis的字典结构和它rehash的方法。

3.1 基本用法


字典属于引用类型,初始化方式主要有2种,分别为:

m1 := make(map[string]int)m2 := map[string]int {    "lvmenglou": 32,    "litinajie": 28,}


字典是被设计成“not addressable”,所以不能直接修改value成员,如果需要修改value成员,需要对元素整体替换:

type user struct {    name string    age byte}m := map[int]user {    1: {"lvmenglou": 32}}m[1].age += 1 // 错误:cannot assign to m[1].age


不能对nil字典进行写操作,否则会触发panic,但是可以读。

var m map[string]intm["a"] = 1 // panic: assignment to entry in nil map


nil与空字典,这个需要注意:

var m1 map[string]int  // nil字典m2 := map[string]int{} // 空字典,不等于nil

map属于非线程安全,如果多个线程同时对一个map进行读、写、删除操作,会触发panic,可以使用支持线程安全的sync.Map。


3.2 内存模型


先看一下map的数据结构:

type hmap struct {    count     int     B         uint8  // bucket的数量是2^B, 最多可以放 loadFactor * 2^B 个元素,再多就要 hashGrow 了    hash0     uint32 // hash seed    buckets    unsafe.Pointer //2^B 大小的数组,如果 count == 0 的话,可能是 nil    oldbuckets unsafe.Pointer // 扩容的时候,buckets 长度会是 oldbuckets 的两倍,只有在 growing 时候为空。    // 其它省略...}type bmap struct {    topbits  [8]uint8    keys     [8]keytype    values   [8]valuetype    pad      uintptr    overflow uintptr}

B是map的bmap数组长度的对数,每个bmap里面存储了kv对,buckets是一个指针,指向实际存储的bmap数组的首地址,存储结构如下图:

image.pngimage.gif

每个bmap里面最多存储 8 个key,下图是bmap的内存模型,HOB Hash 指的就是top hash字段,每个 bucket 设计成最多只能放 8个key-value对,如果有第9个key-value落入当前的bucket,那就需要再构建一个bucket ,通过overflow指针连接起来(可以查看上图)。

image.png

3.3 查找数据


key经过哈希计算后得到哈希值,哈希值是64个bit 位(针对64位机),假如一个 key 经过哈希函数计算后,得到的哈希结果是:

10010111 | 000011110110110010001111001010100010010110010101010 │ 01010


其中最后5位是01010,值为10,表示10号桶。最前面8位10010111,值是151,用来在bmap中找数据用的,详见下图:

image.png


3.4 扩容缩容


一个map最多只能装8*2^B个数据,当数据量快满时,为了减少查询Hash冲突,就需要进行扩容。当bucket数量过多,然后数据又非常少时,就需要进行缩容(之前情况一般出现在数据大量删除的情况)。判断需要扩容和缩容的临界值,需要引入“装载因子”,感兴趣的同学可以自行百度。当进行扩容时,比如B=5扩容到B=6,最低位需要扩到6位,然后重新Hash,找到在[]bmap对应的hash值,最高位不变。缩容的话,就是相反的方式。(因为最低位的第6位是0或者1,所以第6位为0的数据,因为值不变,所以不会重新进行Hash,第6位为1的数据,需要被Hash到扩容后的桶中)

image.gif

为了更好举例,扩容前B=2,共有4个bmap,示例图如下:

image.pngimage.gif

假设overflow太多,触发了等量扩容,需要将数据变得更紧凑,操作如下:

image.png

假设针对上面情况,触发了2倍扩容,将B=2扩容到B=3,操作如下:



image.png


3.5 迭代遍历


本来map的遍历过程比较简单:遍历所有的bucket以及它后面挂的overflow bucket,然后挨个遍历 bucket中的所有 cell。每个bucket中包含8个cell,从有key的cell中取出 key和value,完成遍历。但是遍历如果发生在扩容的过程中,就会涉及到遍历新老 bucket 的过程。所以在遍历过成功,如果map在库容,需要对新旧数据同时进行遍历,下面是扩容过程示例,图中进行二倍扩容后,*oldbuckets中的1已经全部搬迁到了*buckets中,所以遍历时,需要对*oldbuckets和*buckets都进行遍历。

image.png


3.6 总结


对于map的使用,大家肯定都会,所以基础的知识讲解的不多,主要是对map的底层结构进行了详细的讲解,正所谓知其然,必知其所以然!对于map的底层结构设计,感觉有些意思,特别是对于它的hash方式(取前N位和后M位),再结合它的扩容和缩容,其实可以从中提炼一些共性的东西。然后对于Rehash,这个和Redis的Rehash原因一样,这块应该是业内的通用设计方法,感兴趣的同学可以看看redis的字典结构和它rehash的方法。

相关文章
|
20小时前
|
存储 编译器 Go
|
2天前
|
安全 Java Go
探索Go语言在高并发环境中的优势
在当今的技术环境中,高并发处理能力成为评估编程语言性能的关键因素之一。Go语言(Golang),作为Google开发的一种编程语言,以其独特的并发处理模型和高效的性能赢得了广泛关注。本文将深入探讨Go语言在高并发环境中的优势,尤其是其goroutine和channel机制如何简化并发编程,提升系统的响应速度和稳定性。通过具体的案例分析和性能对比,本文揭示了Go语言在实际应用中的高效性,并为开发者在选择合适技术栈时提供参考。
|
21小时前
|
算法 安全 Go
|
2天前
|
监控 NoSQL Go
Go语言中高效使用Redis的Pipeline
Redis 是构建高性能应用时常用的内存数据库,通过其 Pipeline 和 Watch 机制可批量执行命令并确保数据安全性。Pipeline 类似于超市购物一次性结账,减少网络交互时间,提升效率。Go 语言示例展示了如何使用 Pipeline 和 Pipelined 方法简化代码,并通过 TxPipeline 保证操作原子性。Watch 机制则通过监控键变化实现乐观锁,防止并发问题导致的数据不一致。这些机制简化了开发流程,提高了应用程序的性能和可靠性。
7 0
|
4天前
|
NoSQL Go Redis
Go语言中如何扫描Redis中大量的key
在Redis中,遍历大量键时直接使用`KEYS`命令会导致性能瓶颈,因为它会一次性返回所有匹配的键,可能阻塞Redis并影响服务稳定性。为解决此问题,Redis提供了`SCAN`命令来分批迭代键,避免一次性加载过多数据。本文通过两个Go语言示例演示如何使用`SCAN`命令:第一个示例展示了基本的手动迭代方式;第二个示例则利用`Iterator`简化迭代过程。这两种方法均有效地避免了`KEYS`命令的性能问题,并提高了遍历Redis键的效率。
16 0
|
9天前
|
JSON 中间件 Go
go语言后端开发学习(四) —— 在go项目中使用Zap日志库
本文详细介绍了如何在Go项目中集成并配置Zap日志库。首先通过`go get -u go.uber.org/zap`命令安装Zap,接着展示了`Logger`与`Sugared Logger`两种日志记录器的基本用法。随后深入探讨了Zap的高级配置,包括如何将日志输出至文件、调整时间格式、记录调用者信息以及日志分割等。最后,文章演示了如何在gin框架中集成Zap,通过自定义中间件实现了日志记录和异常恢复功能。通过这些步骤,读者可以掌握Zap在实际项目中的应用与定制方法
go语言后端开发学习(四) —— 在go项目中使用Zap日志库
|
6天前
|
运维 Kubernetes Go
"解锁K8s二开新姿势!client-go:你不可不知的Go语言神器,让Kubernetes集群管理如虎添翼,秒变运维大神!"
【8月更文挑战第14天】随着云原生技术的发展,Kubernetes (K8s) 成为容器编排的首选。client-go作为K8s的官方Go语言客户端库,通过封装RESTful API,使开发者能便捷地管理集群资源,如Pods和服务。本文介绍client-go基本概念、使用方法及自定义操作。涵盖ClientSet、DynamicClient等客户端实现,以及lister、informer等组件,通过示例展示如何列出集群中的所有Pods。client-go的强大功能助力高效开发和运维。
28 1
|
7天前
|
SQL 关系型数据库 MySQL
Go语言中使用 sqlx 来操作 MySQL
Go语言因其高效的性能和简洁的语法而受到开发者们的欢迎。在开发过程中,数据库操作不可或缺。虽然Go的标准库提供了`database/sql`包支持数据库操作,但使用起来稍显复杂。为此,`sqlx`应运而生,作为`database/sql`的扩展库,它简化了许多常见的数据库任务。本文介绍如何使用`sqlx`包操作MySQL数据库,包括安装所需的包、连接数据库、创建表、插入/查询/更新/删除数据等操作,并展示了如何利用命名参数来进一步简化代码。通过`sqlx`,开发者可以更加高效且简洁地完成数据库交互任务。
16 1
|
7天前
|
算法 NoSQL 中间件
go语言后端开发学习(六) ——基于雪花算法生成用户ID
本文介绍了分布式ID生成中的Snowflake(雪花)算法。为解决用户ID安全性与唯一性问题,Snowflake算法生成的ID具备全局唯一性、递增性、高可用性和高性能性等特点。64位ID由符号位(固定为0)、41位时间戳、10位标识位(含数据中心与机器ID)及12位序列号组成。面对ID重复风险,可通过预分配、动态或统一分配标识位解决。Go语言实现示例展示了如何使用第三方包`sonyflake`生成ID,确保不同节点产生的ID始终唯一。
go语言后端开发学习(六) ——基于雪花算法生成用户ID
|
8天前
|
JSON 缓存 监控
go语言后端开发学习(五)——如何在项目中使用Viper来配置环境
Viper 是一个强大的 Go 语言配置管理库,适用于各类应用,包括 Twelve-Factor Apps。相比仅支持 `.ini` 格式的 `go-ini`,Viper 支持更多配置格式如 JSON、TOML、YAML
go语言后端开发学习(五)——如何在项目中使用Viper来配置环境