Go实现低性能集合Set

简介: Go实现低性能集合Set

前言


从去年校招入职至今,Java转Go已经有大半年了,在开发过程中发现Go还是有一些痛点的,它的基本数据结构主要是数组、切片、Map,像我们常用到的集合Set其实是没有的,需要自己实现一套。Set表示一个集合,Set里的元素不能重复,实现方式有:


利用Map的Key是唯一的来实现

直接用别人写好的Set,比较成熟的包是https://github.com/deckarep/golang-set


作为一名Bytedancer,当然要享受造轮子的过程,那么现在我们来自己动手写实现一个Set


线程不安全Set实现


我目前使用的是Go 1.16版本,还不支持范型,由于开发中常用string这一基本类型,那么我们就以string为例造一个存string的集合~


  1. 首先构造存String的Set
package hashset
type StringSet map[string]struct{}
func NewStringSet() StringSet {
   return make(map[string]struct{})
}
  1. 新增元素


func (set StringSet) Add(element string) string {
   set[element] = struct{}{}
   return element
}


把元素塞到Map里的Key中,Value是什么我们不关心

  1. 删除元素


func (set StringSet) Remove(element string) string {
   delete(set, element)
   return element
}


调用Go语言提供的一个内置函数 delete(),用于删除Map内键值对


判断一个元素是否存在Set中

func (set StringSet) Contain(element string) bool {
   if _, ok := set[element]; ok {
      return true
   }
   return false
}

这个没啥好说的,利用Map的属性,查看Map中是否存在以element为Key的元素

  1. 计算Set中的所有元素


func (set StringSet) Length() int {
   return len(set)
}


这个也没啥好说的,用内置函数len()就可以解决


UT验证

package hashset
import (
   "fmt"
   "testing"
)
func TestAdd(t *testing.T) {
   set := NewStringSet()
   addElem := set.Add("hello")
   fmt.Printf("add element = %v \n", addElem)
   fmt.Printf("set is %v \n", set)
}
func TestRemove(t *testing.T) {
   set := NewStringSet()
   addElem := set.Add("hello")
   fmt.Printf("add element = %v \n", addElem)
   fmt.Printf("set is %v \n", set)
   removeElem := set.Remove("hello")
   fmt.Printf("remove element = %v \n", removeElem)
   fmt.Printf("set is %v \n", set)
}
func TestContain(t *testing.T) {
   set := NewStringSet()
   addElem := set.Add("hello")
   fmt.Printf("add element = %v \n", addElem)
   fmt.Printf("set is %v \n", set)
   contain := set.Contain("hello")
   fmt.Printf("contain hello element ? %v \n", contain)
   contain = set.Contain("hello golang")
   fmt.Printf("contain hello golang element ? %v \n", contain)
}
func TestLength(t *testing.T) {
   set := NewStringSet()
   set.Add("hello")
   set.Add("hello2")
   set.Add("hello2")
   set.Add("hello3")
   fmt.Printf("set element length is %v \n", set.Length())
}

看起来一切都很美好,但美好的前提却是在单线程的情况下的,那么如果是多线程的情况下,会不会出现线程安全呢?写个UT看看就知道了

func TestConcurrentAdd(t *testing.T) {
   set := NewStringSet()
   for i := 0; i < 100; i++ {
      elem := fmt.Sprintf("%v", i)
      go set.Add(elem)
   }
}


这里开启了100个go协程去给Set添加元素,跑一波就直接panic了

1a7f8b9cf17e434da86a5325f311ebd1.png

错误信息就是fatal error: concurrent map writes


可见我们实现的这个Set,是基于非线程安全的Map上的,所以这自然是一个非线程安全的Set。


线程安全Set实现


  1. 首先构造存String的Set


import "sync"
type SyncStringSet struct {
   m map[string]struct{}
   sync.RWMutex
}
func NewSyncStringSet() *SyncStringSet {
   return &SyncStringSet{
      m: map[string]struct{}{},
   }
}

这里采用了sync包下的RWMutex读写锁来解决并发问题,后续每一个对Map的操作都需要在修改元素前加锁,完成操作后需要释放锁

  1. 新增元素


func (set *SyncStringSet) Add(element string) string {
   set.Lock()
   defer set.Unlock()
   set.m[element] = struct{}{}
   return element
}

删除元素

func (set *SyncStringSet) Remove(element string) string {
   set.Lock()
   defer set.Unlock()
   delete(set.m, element)
   return element
}

判断一个元素是否存在Set中

func (set *SyncStringSet) Contain(element string) bool {
   set.Lock()
   defer set.Unlock()
   if _, ok := set.m[element]; ok {
      return true
   }
   return false
}
  1. 计算Set中的所有元素


func (set *SyncStringSet) Length() int {
   set.Lock()
   defer set.Unlock()
   return len(set.m)
}


UT验证

package hashset
import (
   "fmt"
   "testing"
)
func TestSyncAdd(t *testing.T) {
   set := NewSyncStringSet()
   for i := 0; i < 100; i++ {
      elem := fmt.Sprintf("%v", i)
      go set.Add(elem)
   }
}
func TestSyncRemove(t *testing.T) {
   set := NewSyncStringSet()
   for i := 0; i < 100; i++ {
      elem := fmt.Sprintf("%v", i)
      go set.Add(elem)
   }
   for i := 0; i < 100; i++ {
      elem := fmt.Sprintf("%v", i)
      go set.Remove(elem)
   }
}
func TestSyncContain(t *testing.T) {
   set := NewSyncStringSet()
   for i := 0; i < 100; i++ {
      elem := fmt.Sprintf("%v", i)
      go set.Add(elem)
   }
   for i := 0; i < 100; i++ {
      elem := fmt.Sprintf("%v", i)
      go set.Contain(elem)
   }
}
func TestSyncLength(t *testing.T) {
   set := NewSyncStringSet()
   for i := 0; i < 100; i++ {
      elem := fmt.Sprintf("%v", i)
      go set.Add(elem)
      go set.Length()
   }
}

UT全部跑过,不会出现并发问题了。


总结


造一个低性能的Set就只需要两步:

  • 知道Map的使用
  • 解决并发问题可以采用sync包下的RWMutex
相关文章
|
2月前
|
存储 NoSQL 关系型数据库
Redis 集合(Set)
10月更文挑战第17天
42 5
|
2月前
|
算法 Java 数据处理
从HashSet到TreeSet,Java集合框架中的Set接口及其实现类以其“不重复性”要求,彻底改变了处理唯一性数据的方式。
从HashSet到TreeSet,Java集合框架中的Set接口及其实现类以其“不重复性”要求,彻底改变了处理唯一性数据的方式。HashSet基于哈希表实现,提供高效的元素操作;TreeSet则通过红黑树实现元素的自然排序,适合需要有序访问的场景。本文通过示例代码详细介绍了两者的特性和应用场景。
50 6
|
2月前
|
存储 Java 数据处理
Java Set接口凭借其独特的“不重复”特性,在集合框架中占据重要地位
【10月更文挑战第16天】Java Set接口凭借其独特的“不重复”特性,在集合框架中占据重要地位。本文通过快速去重和高效查找两个案例,展示了Set如何简化数据处理流程,提升代码效率。使用HashSet可轻松实现数据去重,而contains方法则提供了快速查找的功能,彰显了Set在处理大量数据时的优势。
37 2
|
2月前
|
存储 算法 Java
Java Set因其“无重复”特性在集合框架中独树一帜
【10月更文挑战第14天】Java Set因其“无重复”特性在集合框架中独树一帜。本文深入解析Set接口及其主要实现类(如HashSet、TreeSet)如何通过特定的数据结构(哈希表、红黑树)确保元素唯一性,并提供最佳实践建议,包括选择合适的Set实现类和正确实现自定义对象的`hashCode()`与`equals()`方法。
36 3
|
29天前
|
Go API 数据库
Go 语言中常用的 ORM 框架,如 GORM、XORM 和 BeeORM,分析了它们的特点、优势及不足,并从功能特性、性能表现、易用性和社区活跃度等方面进行了比较,旨在帮助开发者根据项目需求选择合适的 ORM 框架。
本文介绍了 Go 语言中常用的 ORM 框架,如 GORM、XORM 和 BeeORM,分析了它们的特点、优势及不足,并从功能特性、性能表现、易用性和社区活跃度等方面进行了比较,旨在帮助开发者根据项目需求选择合适的 ORM 框架。
76 4
|
29天前
|
中间件 Go API
Go语言中几种流行的Web框架,如Beego、Gin和Echo,分析了它们的特点、性能及适用场景,并讨论了如何根据项目需求、性能要求、团队经验和社区支持等因素选择最合适的框架
本文概述了Go语言中几种流行的Web框架,如Beego、Gin和Echo,分析了它们的特点、性能及适用场景,并讨论了如何根据项目需求、性能要求、团队经验和社区支持等因素选择最合适的框架。
70 1
|
1月前
set集合
HashSet(无序,唯一): 基于 HashMap 实现的,底层采用 HashMap 来保存元素。 LinkedHashSet: LinkedHashSet 是 HashSet 的子类,并且其内部是通过 LinkedHashMap 来实现的。 TreeSet(有序,唯一): 红黑树(自平衡的排序二叉树)。
|
1月前
|
存储 Java
判断一个元素是否在 Java 中的 Set 集合中
【10月更文挑战第30天】使用`contains()`方法可以方便快捷地判断一个元素是否在Java中的`Set`集合中,但对于自定义对象,需要注意重写`equals()`方法以确保正确的判断结果,同时根据具体的性能需求选择合适的`Set`实现类。
|
1月前
|
存储 Java 开发者
在 Java 中,如何遍历一个 Set 集合?
【10月更文挑战第30天】开发者可以根据具体的需求和代码风格选择合适的遍历方式。增强for循环简洁直观,适用于大多数简单的遍历场景;迭代器则更加灵活,可在遍历过程中进行更多复杂的操作;而Lambda表达式和`forEach`方法则提供了一种更简洁的函数式编程风格的遍历方式。
|
1月前
|
Java 开发者