深入解密Go语言的byte和rune用法 文本处理从这里开始

简介: 深入解密Go语言的byte和rune用法 文本处理从这里开始

字符处理是字符串处理的基础,Go 语言中提供了 byte 和 rune 两种字符类型。byte 表示 UTF-8 编码的单个字节,rune 表示 UTF-8 编码的 Unicode 代码点。合理运用字符类型可以提高文本处理效率。

本文将详细介绍 byte 和 rune 的区别、表示范围、初始化、遍历、转换等操作,并提供示例代码深入理解这两种字符类型的用法。

1

 

一、byte 类型

byte 类型代表了 UTF-8 编码的单个字节。byte 实际上是一个 uint8 的别名:

type byte = uint8

byte 的取值范围是 0-255。

2

 

二、byte 的初始化

可以直接赋值初始化 byte:

var a byte = 'A'

也可以通过 uint8()转换初始化:

a := byte(uint8(97))

比特位操作也可以生成 byte 值。

3

 

三、byte 的常见操作

  • 遍历字符串生成 byte 序列
  • 转换为 int 获取字节值
  • 格式化输出
  • 比特位操作

示例:

for i, b := range []byte("Hello") {
  fmt.Printf("%d:%c ", i, b) 
}
a := byte('a')
fmt.Println(int(a)) // 97


4

 

四、byte 类型的应用

  • 表示文本文件等数据流中的单个字节
  • 构建自定义文本编码
  • 二进制文件解析
  • 网络数据包处理

5

 

五、rune 类型

rune 类型用来表示一个 UTF-8 编码的 Unicode 字符:

type rune = int32

rune 实际是 int32 的别名,可以表示单个 Unicode 字符。

6

 

六、rune 初始化

直接用单引号'初始化 rune:

r := 'a'

或者通过类型转换初始化:

r := rune(97)

接受 int 类型参数,必须正确表示一个 Unicode 字符。

7

 

七、rune 的常见操作

  • 遍历字符串得到 rune 序列
  • 与 int 相互转换
  • 将 rune 作为字符输出
  • 字符分类判断

示例:

for i, r := range "Hello" {
  fmt.Printf("%d: %c\n", i, r)
}
fmt.Println(int('A')) //65
if isLetter(r) {
  //todo
}

8

 

八、rune 的应用场景

  • 表示 Unicode 字符
  • 遍历和处理文本
  • 文字分类和判断
  • 文本编码转换

9

 

总结

通过本文,我们全面了解到了 Go 语言的 byte 和 rune 的定义、区别、初始化和操作。合理利用字符类型可以简化文本处理,我们应该根据不同的处理需求选择合适的 byte 或 rune 类型。这将有助于我们编写简洁实用的 Go 语言程序。


目录
相关文章
|
1天前
|
程序员 Go PHP
为什么大部分的 PHP 程序员转不了 Go 语言?
【9月更文挑战第8天】大部分 PHP 程序员难以转向 Go 语言,主要因为:一、编程习惯与思维方式差异,如语法风格和编程范式;二、学习成本高,需掌握新知识体系且面临项目压力;三、职业发展考量,现有技能价值及市场需求不确定性。学习新语言虽有挑战,但对拓宽职业道路至关重要。
22 10
|
2天前
|
算法 程序员 Go
PHP 程序员学会了 Go 语言就能唬住面试官吗?
【9月更文挑战第8天】学会Go语言可提升PHP程序员的面试印象,但不足以 solely “唬住” 面试官。学习新语言能展现学习能力、拓宽技术视野,并增加就业机会。然而,实际项目经验、深入理解语言特性和综合能力更为关键。全面展示这些方面才能真正提升面试成功率。
20 10
|
1天前
|
编译器 Go
go语言学习记录(关于一些奇怪的疑问)有别于其他编程语言
本文探讨了Go语言中的常量概念,特别是特殊常量iota的使用方法及其自动递增特性。同时,文中还提到了在声明常量时,后续常量可沿用前一个值的特点,以及在遍历map时可能遇到的非顺序打印问题。
|
6天前
|
安全 大数据 Go
深入探索Go语言并发编程:Goroutines与Channels的实战应用
在当今高性能、高并发的应用需求下,Go语言以其独特的并发模型——Goroutines和Channels,成为了众多开发者眼中的璀璨明星。本文不仅阐述了Goroutines作为轻量级线程的优势,还深入剖析了Channels作为Goroutines间通信的桥梁,如何优雅地解决并发编程中的复杂问题。通过实战案例,我们将展示如何利用这些特性构建高效、可扩展的并发系统,同时探讨并发编程中常见的陷阱与最佳实践,为读者打开Go语言并发编程的广阔视野。
|
3天前
|
存储 Shell Go
Go语言结构体和元组全面解析
Go语言结构体和元组全面解析
|
8天前
|
Go
golang语言之go常用命令
这篇文章列出了常用的Go语言命令,如`go run`、`go install`、`go build`、`go help`、`go get`、`go mod`、`go test`、`go tool`、`go vet`、`go fmt`、`go doc`、`go version`和`go env`,以及它们的基本用法和功能。
20 6
|
8天前
|
存储 Go
Golang语言基于go module方式管理包(package)
这篇文章详细介绍了Golang语言中基于go module方式管理包(package)的方法,包括Go Modules的发展历史、go module的介绍、常用命令和操作步骤,并通过代码示例展示了如何初始化项目、引入第三方包、组织代码结构以及运行测试。
16 3
|
10月前
|
Java
java 读取文件 获取byte[]字节 并执行Gzip的压缩和解压
java 读取文件 获取byte[]字节 并执行Gzip的压缩和解压
93 0
|
2月前
|
Java Apache Maven
Java:commons-codec实现byte数组和16进制字符串转换
在上述代码中,`Hex.encodeHexString(bytes)`用于将byte数组转换为16进制字符串,`Hex.decodeHex(hexString)`用于将16进制字符串转换为byte数组。
24 0
|
2月前
|
Java Apache Maven
Java:commons-codec实现byte数组和16进制字符串转换
在上述代码中,`Hex.encodeHexString(bytes)`用于将byte数组转换为16进制字符串,`Hex.decodeHex(hexString)`用于将16进制字符串转换为byte数组。
36 0