Golang 中的字符串:常见错误和最佳实践

简介: Golang 中的字符串:常见错误和最佳实践

1024


在这个对程序员有意义的节日里,希望大家快乐,少加班,开开心心写代码。


正题


在这篇文章中,我们将讨论 Golang 中的字符串,并查看一些不同的场景,以避免常见错误。让我们深入探讨!


1. 字符串是否可以为 nil?


我们已经对 Golang 中的字符串有了基本的了解,但我们可以从 Golang 字符串不能为 nil 开始,除非您使用指向字符串的指针。


如下代码所示,当我们创建一个字符串变量时,默认值必须是空的""。如果我们用 nil 值初始化字符串变量,我们将面临在变量声明中不能使用 nil 作为字符串值的错误。例如:


func main() {
 var s string
 s = nil // Cannot use 'nil' as the type string
 fmt.Println(s)
}


编译器会提示我们不能使用 nil 赋予 string 类型。因此,我们可以只是定义变量,或者使用""作为默认值:


func main() {
 var s string
 var ss = ""
 fmt.Println(s, ss)
}


如果我们坚持在字符串类型变量中使用 nil 值,则应使用指针,如下所示:


func main() {
 var s *string
 fmt.Println(s)
}


这个时候输出则为:


<nil>


但是,我们必须谨慎使用这种方法。每次要为变量赋值时,我们都必须编写更多的代码,而且在赋新值之前还要检查是否有零值或前一个值。


func main() {
 var s *string
 tmp := "hello"
 s = &tmp
 fmt.Printf("address: %+v, value: %s", s, *s)
}


这个时候打印出来 s 的地址以及所指向的值:


address: 0xc00008a030, value: hello


2. 字符串是不可变的


Golang 中的字符串是不可变的,这意味着我们不能更改每个字符的值。例如:


func main() {
 tmp := "hello"
 tmp[0] = 'J'
 fmt.Println(tmp)
}


上述代码会导致编译时错误,因为无法赋值给 tmp[0]


更改字符串中单个字符的常见错误如下:


func main() {
 tmp := "hello"
 tbs := []byte(tmp)
 tbs[0] = 'J'
 fmt.Println(string(tbs))
 chi := "你好"
 chiTBS := []byte(chi)
 chiTBS[0] = 'J'
 fmt.Println(string(chiTBS))
}


输出为:


Jello
J��好


虽然第一个输出显示的结果符合我们的预期,但这并不是更改某个字符的正确方法。


这是因为我们打算修改的单个部分可能存储在多个字节中,即使你想将变量转换为符文类型并更改你想要的部分,我也不得不说,这是不可能做到的,因为它可能被放置在多个符文中,我们需要谨慎行事!



3. 字符串是字节数组


在 Golang 中,字符串由字节(字节的片段)组成,某些字符需要存储在多个字节中,例如:"♥"。


因此,当需要确定一个字符串类型变量的长度时,我们必须谨慎编码。例如


func main() {
 tmp := "¥"
 fmt.Println("bytes: ", len(tmp))
 fmt.Println("runes: ", utf8.RuneCountInString(tmp))
}


len 函数返回的是字符串的字节数,而不是字符数。当我们需要找出字符串的符文数时,可以使用 uft8.RuneCountIntString() 函数。

另一个常见的误解是使用 uft8.RuneCountIntString() 来确定字符数,但这并不是在任何情况下都正确,因为一个字符串变量可能跨越多个符文。请看这个例子:


func main() {
 tmp := "❤️"
 fmt.Println("bytes: ", len(tmp))
 fmt.Println("runes: ", utf8.RuneCountInString(tmp))
}


输出为:


bytes:  6
runes:  2


4. 字符串索引和forrange


在 Golang 中,使用索引检索字符串的单个部分将为我们提供字符的 uint 值,并且只能检索第一个字节。但在字符串变量的 for 循环中,我们可以访问每个字符的符值:


func main() {
 tmp := "❤¥%……&*"
 fmt.Printf("char at 0 index, has type %T and value is %+v\n", tmp[0], tmp[0])
 for _, t := range tmp {
  fmt.Printf("value is %+v type is %T\n", t, t)
 }
}


输出:


char at 0 index, has type uint8 and value is 226
value is 10084 type is int32
value is 65509 type is int32
value is 37 type is int32
value is 8230 type is int32
value is 8230 type is int32
value is 38 type is int32
value is 42 type is int32


在对字符串进行迭代时,还要注意变量中可能存在的非 UTF8 字符,如果 Golang 无法将其理解为 UTF8,则会使用 unicode 替换而非实际值。


5. 字符串平等


在 Golang 中,我们总是可以使用 == 来检查简单的字符串是否相等,但如果我们的变量存在隐藏点,则应在比较两个字符串变量之前使用 unicode 规范包将其规范化:


func main() {
 cafe1 := "Café"
 cafe2 := "Cafe\u0301"
 normalizeCafe1 := norm.NFC.String(cafe1)
 normalizeCafe2 := norm.NFC.String(cafe2)
 fmt.Println(cafe1 == cafe2)
 fmt.Println(normalizeCafe1 == normalizeCafe2)
}


6. 高效字符串构建


使用“+”连接大量字符串的效率可能非常低。使用 strings.Builder 是高效构建字符串的最佳方法之一:


func main() {
 sb := strings.Builder{}
 for i := 0; i < 1000; i++ {
  sb.WriteString("hello ")
 }
 result := sb.String()
 fmt.Println(result)
}


与传统的 + 连接方法相比,这种方法速度更快,内存消耗更少,而且可以避免创建不必要的中间字符串。我们还可以使用 bytes.Buffer 软件包来实现这一目标。


总结

  • 字符串的默认值是""
  • lenRuneCountIntString 函数具有不同的行为
  • 我们应该小心 for 循环和字符串
  • 字符串相等是我们需要更精确的地方
相关文章
|
6月前
|
Go
golang力扣leetcode 467.环绕字符串中唯一的子字符串
golang力扣leetcode 467.环绕字符串中唯一的子字符串
44 0
|
2月前
|
Go
Golang语言基本数据类型默认值及字符串之间互相转换案例
这篇文章讲解了Golang语言中基本数据类型的默认值、类型转换的概述以及整型、浮点型、字符串之间的相互转换案例,包括如何将基本数据类型转换为字符串类型和字符串类型转换为基本数据类型,以及字符串与字节切片之间的转换。
18 2
|
2月前
|
Go
Golang语言基础数据类型之字符串常用的操作
这篇文章介绍了Golang语言中字符串的定义、常用操作,包括字符串长度查看、遍历、类型转换、子串统计、比较、查找位置、替换、切割、大小写转换、剔除字符、前缀后缀判断、拼接、子串包含判断以及字符串join操作,同时提供了官方文档的查看方法。
20 1
|
3月前
|
数据库连接 Go API
Golang中的25个常见错误:更好地进行go编程的综合指南
Golang中的25个常见错误:更好地进行go编程的综合指南
|
3月前
|
Go
[golang]字符串拼接
[golang]字符串拼接
|
3月前
|
Go 开发者
|
4月前
|
中间件 测试技术 Go
Golang中的错误处理最佳实践
【7月更文挑战第10天】在Golang中,错误处理是核心且重要的。最佳实践包括:定义明确的错误类型,使用错误链(如`%w`包装错误),始终检查错误(避免忽略),谨慎使用`panic`和`recover`,利用多值返回处理错误,标准化错误处理逻辑,并确保测试错误处理代码。这些做法有助于构建健壮和可维护的程序。
|
5月前
|
Go
【golang】golang 字符串切片排序
【golang】golang 字符串切片排序
67 1
|
5月前
|
Go
【golang】Go 判断字符串是否包含指定字符
【golang】Go 判断字符串是否包含指定字符
77 1
|
6月前
|
存储 Go 开发者
Golang深入浅出之-Go语言字符串操作:常见函数与面试示例
【4月更文挑战第20天】Go语言字符串是不可变的字节序列,采用UTF-8编码。本文介绍了字符串基础,如拼接(`+`或`fmt.Sprintf()`)、长度与索引、切片、查找与替换(`strings`包)以及转换与修剪。常见问题包括字符串不可变性、UTF-8编码处理、切片与容量以及查找与替换的边界条件。通过理解和实践这些函数及注意事项,能提升Go语言编程能力。
180 0