Golang 中的 String、rune 和 byte

简介: Golang 中的 String、rune 和 byte

解释


String


Go语言中,string就是只读的采用utf8编码的字节切片(slice) 因此用len函数获取到的长度并不是字符个数,而是字节个数。 for循环遍历输出的也是各个字节。


rune


runeint32的别名,代表字符的Unicode编码,采用4个字节存储,将string转成rune就意味着任何一个字符都用4个字节来存储其unicode值,这样每次遍历的时候返回的就是unicode值,而不再是字节了,这样就可以解决乱码问题了


byte


bytes操作的对象也是字节切片,与string的不可变不同,byte是可变的,因此string按增量方式构建字符串会导致多次内存分配和复制,使用bytes就不会因而更高效一点


转换方式


String、bytes 相互转换


String to bytes


func main() {
 str := "Hello, Golang!"
 fmt.Println(string2bytes1(str))
 fmt.Println(string2bytes2(str))
 fmt.Println(string2bytes3(str))
}
func string2bytes1(str string) []byte {
 bs := make([]byte, 0)
 for i := 0; i < len(str); i++ {
  bs = append(bs, str[i])
 }
 return bs
}
func string2bytes2(str string) []byte {
 return []byte(str)
}
func string2bytes3(s string) []byte {
 sh := (*reflect.StringHeader)(unsafe.Pointer(&s))
 bh := reflect.SliceHeader{
  Data: sh.Data,
  Len:  sh.Len,
  Cap:  sh.Len,
 }
 return *(*[]byte)(unsafe.Pointer(&bh))
}


前两个方法是非常标准的转换方式,第三种方式使用了 unsafereflect 处理,是个不安全的做法,而且 StringHeader 在我使用的 1.21 已经废弃了。


bytes to String


func main() {
 str := "Hello, Golang!"
 bs := string2bytes3(str)
 fmt.Println(bytes2string1(bs))
 fmt.Println(bytes2string2(bs))
}
func bytes2string1(bs []byte) string {
 return string(bs)
}
func bytes2string2(bs []byte) string {
 return *(*string)(unsafe.Pointer(&bs))
}


第一种转换也是一个非常标准的转换方式,第二个方式使用了不安全的做法。


String、rune 相互转换


String to rune


func main() {
 str := "Hello, 中国!"
 fmt.Println(string2rune1(str))
 fmt.Println(string2rune2(str))
}
func string2rune1(str string) []rune {
 rs := make([]rune, 0)
 for _, r := range str {
  rs = append(rs, r)
 }
 return rs
}
func string2rune2(str string) []rune {
 return []rune(str)
}


这里的 for range 和上面 for index 是不一样的,索引字符串产生字节。For range 循环每次迭代都会解码一个 UTF-8 编码的符文,因此值类型是 rune。


rune to String


func main() {
 str := "Hello, 中国!"
 rs := string2rune2(str)
 fmt.Println(rune2string1(rs))
}
func rune2string1(rs []rune) string {
 return string(rs)
}


rune、bytes 相互转换


[]rune 和 []byte 的相互转换需要先转成字符串再转换。


func main() {
 str := "Hello, 中国!"
 rs := string2rune1(str)
 bs := string2bytes1(str)
 convertedBytes := rune2bytes(rs)
 convertedRunes := bytes2rune(bs)
 fmt.Println(bs)
 fmt.Println(convertedBytes)
 fmt.Println(rs)
 fmt.Println(convertedRunes)
}
func rune2bytes(rs []rune) []byte {
 return []byte(string(rs))
}
func bytes2rune(bs []byte) []rune {
 return []rune(string(bs))
}


总结


希望大家通过这篇文章可以巩固自己对这几种类型的理解,以及更方便的对它们进行转换。

相关文章
|
4月前
|
测试技术 Go API
golang []byte和string的高性能转换
golang []byte和string的高性能转换
47 1
|
4月前
|
安全 Go 开发者
new String()定义字符串为空,char[] chs = {‘a‘,‘b‘,‘c‘} String s2 = new String(chs) 输出abc,byte定99为a
new String()定义字符串为空,char[] chs = {‘a‘,‘b‘,‘c‘} String s2 = new String(chs) 输出abc,byte定99为a
|
7月前
|
Go 机器学习/深度学习 Rust
Golang每日一练(leetDay0119) 反转字符串I\II Reverse String
Golang每日一练(leetDay0119) 反转字符串I\II Reverse String
92 0
Golang每日一练(leetDay0119) 反转字符串I\II Reverse String
|
7月前
|
存储 编译器 Go
Golang底层原理剖析之string类型与字符编码
Golang底层原理剖析之string类型与字符编码
68 0
byte[]转换成String
byte[]转换成String
|
存储 自然语言处理 Java
Java_9_为何要将_String_的底层实现由_char[]_改成了_byte[]_?
Java_9_为何要将_String_的底层实现由_char[]_改成了_byte[]_?
|
Go 开发者 索引
100天精通Golang(基础入门篇)——第13天:深入解析Go语言中的字符串(string)及常用函数应用
100天精通Golang(基础入门篇)——第13天:深入解析Go语言中的字符串(string)及常用函数应用
104 0
|
Java
Java中 String与基本数据类型,包装类,char[],byte[]之间的转换
Java中 String与基本数据类型,包装类,char[],byte[]之间的转换
97 0
|
Go
Go处理中文 string 转为 rune 数组
Go处理中文 string 转为 rune 数组
121 0