Go实现低性能集合Set

简介: Go实现低性能集合Set

前言


从去年校招入职至今,Java转Go已经有大半年了,在开发过程中发现Go还是有一些痛点的,它的基本数据结构主要是数组、切片、Map,像我们常用到的集合Set其实是没有的,需要自己实现一套。Set表示一个集合,Set里的元素不能重复,实现方式有:


利用Map的Key是唯一的来实现

直接用别人写好的Set,比较成熟的包是https://github.com/deckarep/golang-set


作为一名Bytedancer,当然要享受造轮子的过程,那么现在我们来自己动手写实现一个Set


线程不安全Set实现


我目前使用的是Go 1.16版本,还不支持范型,由于开发中常用string这一基本类型,那么我们就以string为例造一个存string的集合~


  1. 首先构造存String的Set
package hashset
type StringSet map[string]struct{}
func NewStringSet() StringSet {
   return make(map[string]struct{})
}
  1. 新增元素


func (set StringSet) Add(element string) string {
   set[element] = struct{}{}
   return element
}


把元素塞到Map里的Key中,Value是什么我们不关心

  1. 删除元素


func (set StringSet) Remove(element string) string {
   delete(set, element)
   return element
}


调用Go语言提供的一个内置函数 delete(),用于删除Map内键值对


判断一个元素是否存在Set中

func (set StringSet) Contain(element string) bool {
   if _, ok := set[element]; ok {
      return true
   }
   return false
}

这个没啥好说的,利用Map的属性,查看Map中是否存在以element为Key的元素

  1. 计算Set中的所有元素


func (set StringSet) Length() int {
   return len(set)
}


这个也没啥好说的,用内置函数len()就可以解决


UT验证

package hashset
import (
   "fmt"
   "testing"
)
func TestAdd(t *testing.T) {
   set := NewStringSet()
   addElem := set.Add("hello")
   fmt.Printf("add element = %v \n", addElem)
   fmt.Printf("set is %v \n", set)
}
func TestRemove(t *testing.T) {
   set := NewStringSet()
   addElem := set.Add("hello")
   fmt.Printf("add element = %v \n", addElem)
   fmt.Printf("set is %v \n", set)
   removeElem := set.Remove("hello")
   fmt.Printf("remove element = %v \n", removeElem)
   fmt.Printf("set is %v \n", set)
}
func TestContain(t *testing.T) {
   set := NewStringSet()
   addElem := set.Add("hello")
   fmt.Printf("add element = %v \n", addElem)
   fmt.Printf("set is %v \n", set)
   contain := set.Contain("hello")
   fmt.Printf("contain hello element ? %v \n", contain)
   contain = set.Contain("hello golang")
   fmt.Printf("contain hello golang element ? %v \n", contain)
}
func TestLength(t *testing.T) {
   set := NewStringSet()
   set.Add("hello")
   set.Add("hello2")
   set.Add("hello2")
   set.Add("hello3")
   fmt.Printf("set element length is %v \n", set.Length())
}

看起来一切都很美好,但美好的前提却是在单线程的情况下的,那么如果是多线程的情况下,会不会出现线程安全呢?写个UT看看就知道了

func TestConcurrentAdd(t *testing.T) {
   set := NewStringSet()
   for i := 0; i < 100; i++ {
      elem := fmt.Sprintf("%v", i)
      go set.Add(elem)
   }
}


这里开启了100个go协程去给Set添加元素,跑一波就直接panic了

1a7f8b9cf17e434da86a5325f311ebd1.png

错误信息就是fatal error: concurrent map writes


可见我们实现的这个Set,是基于非线程安全的Map上的,所以这自然是一个非线程安全的Set。


线程安全Set实现


  1. 首先构造存String的Set


import "sync"
type SyncStringSet struct {
   m map[string]struct{}
   sync.RWMutex
}
func NewSyncStringSet() *SyncStringSet {
   return &SyncStringSet{
      m: map[string]struct{}{},
   }
}

这里采用了sync包下的RWMutex读写锁来解决并发问题,后续每一个对Map的操作都需要在修改元素前加锁,完成操作后需要释放锁

  1. 新增元素


func (set *SyncStringSet) Add(element string) string {
   set.Lock()
   defer set.Unlock()
   set.m[element] = struct{}{}
   return element
}

删除元素

func (set *SyncStringSet) Remove(element string) string {
   set.Lock()
   defer set.Unlock()
   delete(set.m, element)
   return element
}

判断一个元素是否存在Set中

func (set *SyncStringSet) Contain(element string) bool {
   set.Lock()
   defer set.Unlock()
   if _, ok := set.m[element]; ok {
      return true
   }
   return false
}
  1. 计算Set中的所有元素


func (set *SyncStringSet) Length() int {
   set.Lock()
   defer set.Unlock()
   return len(set.m)
}


UT验证

package hashset
import (
   "fmt"
   "testing"
)
func TestSyncAdd(t *testing.T) {
   set := NewSyncStringSet()
   for i := 0; i < 100; i++ {
      elem := fmt.Sprintf("%v", i)
      go set.Add(elem)
   }
}
func TestSyncRemove(t *testing.T) {
   set := NewSyncStringSet()
   for i := 0; i < 100; i++ {
      elem := fmt.Sprintf("%v", i)
      go set.Add(elem)
   }
   for i := 0; i < 100; i++ {
      elem := fmt.Sprintf("%v", i)
      go set.Remove(elem)
   }
}
func TestSyncContain(t *testing.T) {
   set := NewSyncStringSet()
   for i := 0; i < 100; i++ {
      elem := fmt.Sprintf("%v", i)
      go set.Add(elem)
   }
   for i := 0; i < 100; i++ {
      elem := fmt.Sprintf("%v", i)
      go set.Contain(elem)
   }
}
func TestSyncLength(t *testing.T) {
   set := NewSyncStringSet()
   for i := 0; i < 100; i++ {
      elem := fmt.Sprintf("%v", i)
      go set.Add(elem)
      go set.Length()
   }
}

UT全部跑过,不会出现并发问题了。


总结


造一个低性能的Set就只需要两步:

  • 知道Map的使用
  • 解决并发问题可以采用sync包下的RWMutex
相关文章
|
6天前
|
监控 算法 安全
带用集合算法set union讲解
带用集合算法set union讲解
22 0
|
6天前
|
存储 安全 Java
java集合框架及其特点(List、Set、Queue、Map)
java集合框架及其特点(List、Set、Queue、Map)
|
6天前
|
JavaScript 前端开发 定位技术
JavaScript 中如何代理 Set(集合) 和 Map(映射)
JavaScript 中如何代理 Set(集合) 和 Map(映射)
55 0
|
6天前
|
存储 算法 编译器
掌握Go语言:探索Go语言递归函数的高级奥秘,优化性能、实现并发、解决算法难题(28)
掌握Go语言:探索Go语言递归函数的高级奥秘,优化性能、实现并发、解决算法难题(28)
|
6天前
|
存储 安全 Java
Java一分钟之-集合框架进阶:Set接口与HashSet
【5月更文挑战第10天】本文介绍了Java集合框架中的`Set`接口和`HashSet`类。`Set`接口继承自`Collection`,特征是不允许重复元素,顺序不确定。`HashSet`是`Set`的实现,基于哈希表,提供快速添加、删除和查找操作,但无序且非线程安全。文章讨论了`HashSet`的特性、常见问题(如元素比较规则、非唯一性和线程安全性)以及如何避免这些问题,并提供了代码示例展示基本操作和自定义对象的使用。理解这些概念和注意事项能提升代码效率和可维护性。
13 0
|
6天前
|
Java 大数据 Go
Go vs Java:在大数据处理领域的性能对比
Go与Java在大数据处理中各有特点。Go启动快,内存占用少,静态类型及并发模型(goroutine和channel)使其在并发性能上有优势。Java虽然启动慢,JVM内存占用高,但拥有丰富的生态系统和并发工具。代码示例展示了Go的goroutine和Java的线程池处理大数据的场景。在性能上,Go可能更优,但Java的跨平台性和生态广度使其仍被广泛应用。
|
6天前
|
存储 安全 Java
Java集合篇之set,面试官:请说一说HashSet、LinkedHashSet、TreeSet的区别?
Java集合篇之set,面试官:请说一说HashSet、LinkedHashSet、TreeSet的区别?
15 0
|
6天前
|
程序员 索引 Python
06-python数据容器-set(集合)入门基础操作
06-python数据容器-set(集合)入门基础操作
|
6天前
|
存储 缓存 安全
掌握Go语言:Go语言Map,高效键值对集合的应用与注意事项详解(26)
掌握Go语言:Go语言Map,高效键值对集合的应用与注意事项详解(26)
|
6天前
|
存储 安全 Java
Java集合详解(List、Map、Set)
Java集合详解(List、Map、Set)
34 4