Go 语言入门很简单:正则表达式(下)

简介: 在计算中,我们经常需要将特定模式的字符或字符子集匹配为另一个字符串中的字符串。此技术用于使用特别的语法来搜索给定字符串中的特定字符集。比如邮件、手机号、身份证号等等。如果搜索到的模式匹配,或者在目标字符串中找到给定的子集,则搜索被称为成功;否则被认为是不成功的。那么此时该用到正则表达式了。

Split 函数

Split 函数将字符串切割成由定义的正则表达式分隔的子字符串。它返回这些表达式匹配之间的子字符串切片。

 package main
 
 import (
     "fmt"
     "log"
     "regexp"
     "strconv"
 )
 
 func main() {
 
     var data = `22, 1, 3, 4, 5, 17, 4, 3, 21, 4, 5, 1, 48, 9, 42`
 
     sum := 0
 
     re := regexp.MustCompile(",\s*")
 
     vals := re.Split(data, -1)
 
     for _, val := range vals {
 
         n, err := strconv.Atoi(val)
 ​
         sum += n
 ​
         if err != nil {
             log.Fatal(err)
         }
     }
 ​
     fmt.Println(sum)
 }

在代码示例中,我们有一个逗号分隔的值列表。我们从字符串中截取值并计算它们的总和。

 re := regexp.MustCompile(",\s*")

正则表达式包括一个逗号字符和任意数量的相邻空格。

 vals := re.Split(data, -1)

我们得到了值的一部分。

 for _, val := range vals {
 ​
     n, err := strconv.Atoi(val)
 ​
     sum += n
 ​
     if err != nil {
         log.Fatal(err)
     }
 }

我们遍历切片并计算总和。切片包含字符串;因此,我们使用 strconv.Atoi 函数将每个字符串转换为整数。

运行代码:

 189

Go 正则表达式捕获组

圆括号 () 用于创建捕获组。这允许我们将量词应用于整个组或将交替限制为正则表达式的一部分。为了找到捕获组(Go 使用术语子表达式),我们使用 FindStringSubmatch 函数。

 package main
 ​
 import (
     "fmt"
     "regexp"
 )
 ​
 func main() {
 ​
     websites := [...]string{"webcode.me", "zetcode.com", "freebsd.org", "netbsd.org"}
 ​
     re := regexp.MustCompile("(\w+)\.(\w+)")
 ​
     for _, website := range websites {
 ​
         parts := re.FindStringSubmatch(website)
 ​
         for i, _ := range parts {
             fmt.Println(parts[i])
         }
 ​
         fmt.Println("---------------------")
     }
 }

在代码示例中,我们使用组将域名分为两部分。

 re := regexp.MustCompile("(\w+)\.(\w+)")

我们用括号定义了两个组。

 parts := re.FindStringSubmatch(website)

FindStringSubmatch 返回包含匹配项的字符串切片,包括来自捕获组的字符串。

运行代码:

 $ go run capturegroups.go 
 webcode.me
 webcode
 me
 ---------------------
 zetcode.com
 zetcode
 com
 ---------------------
 freebsd.org
 freebsd
 org
 ---------------------
 netbsd.org
 netbsd
 org
 ---------------------

正则表达式替换字符串

可以用 ReplaceAllString 替换字符串。该方法返回修改后的字符串。

package main  import (     "fmt"     "io/ioutil"     "log"     "net/http"     "regexp"     "strings" )  func main() {      resp, err := http.Get("http://webcode.me")      if err != nil {         log.Fatal(err)     }      defer resp.Body.Close()      body, err := ioutil.ReadAll(resp.Body)      if err != nil {          log.Fatal(err)     }      content := string(body)      re := regexp.MustCompile("<[^>]*>")     replaced := re.ReplaceAllString(content, "")      fmt.Println(strings.TrimSpace(replaced)) }

复制代

 package main
 ​
 import (
     "fmt"
     "io/ioutil"
     "log"
     "net/http"
     "regexp"
     "strings"
 )
 ​
 func main() {
 ​
     resp, err := http.Get("http://webcode.me")
 ​
     if err != nil {
         log.Fatal(err)
     }
 ​
     defer resp.Body.Close()
 ​
     body, err := ioutil.ReadAll(resp.Body)
 ​
     if err != nil {
 ​
         log.Fatal(err)
     }
 ​
     content := string(body)
 ​
     re := regexp.MustCompile("<[^>]*>")
     replaced := re.ReplaceAllString(content, "")
 ​
     fmt.Println(strings.TrimSpace(replaced))
 }

该示例读取网页的 HTML 数据并使用正则表达式去除其 HTML 标记。

 resp, err := http.Get("http://webcode.me")

我们使用 http 包中的 Get 函数创建一个 GET 请求。

 body, err := ioutil.ReadAll(resp.Body)

我们读取响应对象的主体。

 re := regexp.MustCompile("<[^>]*>")

这个模式定义了一个匹配 HTML 标签的正则表达式。

 replaced := re.ReplaceAllString(content, "")

我们使用 ReplaceAllString 方法删除所有标签。

ReplaceAllStringFunc 函数

ReplaceAllStringFunc 返回一个字符串的副本,其中正则表达式的所有匹配项都已替换为指定函数的返回值。

 package main
 ​
 import (
     "fmt"
     "regexp"
     "strings"
 )
 ​
 func main() {
 ​
     content := "an old eagle"
 ​
     re := regexp.MustCompile(`[^aeiou]`)
 ​
     fmt.Println(re.ReplaceAllStringFunc(content, strings.ToUpper))
 }

在代码示例中,我们将 strings.ToUpper 函数应用于字符串的所有字符。

 $ go run replaceallfunc.go 
 aN oLD eaGLe

总结

模式匹配在根据基于正则表达式和语法的特定搜索模式在字符串中搜索某些字符集时起着重要作用。匹配的模式允许我们从字符串中提取所需的数据并以我们喜欢的方式对其进行操作。理解和使用正则表达式是处理文本的关键。


在实际过程中,程序员会保留一组常用的正则表达式来匹配电子邮件、电话号码等,并在需要时使用和重用它。


本文只是简单挑选了一些常见的函数进行介绍,其实 regexp 包还有更多的函数,留给读者自己去探索和研究。

相关文章
|
1天前
|
Java 编译器 Go
探索Go语言的性能优化技巧
在本文中,我们将深入探讨Go语言的底层机制,以及如何通过代码层面的优化来提升程序性能。我们将讨论内存管理、并发控制以及编译器优化等关键领域,为你提供一系列实用的技巧和最佳实践。
|
1天前
|
Cloud Native Go API
Go语言在微服务架构中的创新应用与实践
本文深入探讨了Go语言在构建高效、可扩展的微服务架构中的应用。Go语言以其轻量级协程(goroutine)和强大的并发处理能力,成为微服务开发的首选语言之一。通过实际案例分析,本文展示了如何利用Go语言的特性优化微服务的设计与实现,提高系统的响应速度和稳定性。文章还讨论了Go语言在微服务生态中的角色,以及面临的挑战和未来发展趋势。
|
1天前
|
安全 Go 调度
探索Go语言的并发模式:协程与通道的协同作用
Go语言以其并发能力闻名于世,而协程(goroutine)和通道(channel)是实现并发的两大利器。本文将深入了解Go语言中协程的轻量级特性,探讨如何利用通道进行协程间的安全通信,并通过实际案例演示如何将这两者结合起来,构建高效且可靠的并发系统。
|
1天前
|
安全 Go 开发者
破译Go语言中的并发模式:从入门到精通
在这篇技术性文章中,我们将跳过常规的摘要模式,直接带你进入Go语言的并发世界。你将不会看到枯燥的介绍,而是一段代码的旅程,从Go的并发基础构建块(goroutine和channel)开始,到高级模式的实践应用,我们共同探索如何高效地使用Go来处理并发任务。准备好,让Go带你飞。
|
2天前
|
运维 Go 开发者
Go语言在微服务架构中的应用与优势
本文深入探讨了Go语言在构建微服务架构中的独特优势和实际应用。通过分析Go语言的核心特性,如简洁的语法、高效的并发处理能力以及强大的标准库支持,我们揭示了为何Go成为开发高性能微服务的首选语言。文章还详细介绍了Go语言在微服务架构中的几个关键应用场景,包括服务间通信、容器化部署和自动化运维等,旨在为读者提供实用的技术指导和启发。
|
2天前
|
安全 Go 调度
探索Go语言的并发之美:goroutine与channel
在这个快节奏的技术时代,Go语言以其简洁的语法和强大的并发能力脱颖而出。本文将带你深入Go语言的并发机制,探索goroutine的轻量级特性和channel的同步通信能力,让你在高并发场景下也能游刃有余。
|
3天前
|
Go 开发者
Go语言中的并发编程:从基础到实践
在当今的软件开发中,并发编程已经成为了一项不可或缺的技能。Go语言以其简洁的语法和强大的并发支持,成为了开发者们的首选。本文将带你深入了解Go语言中的并发编程,从基础概念到实际应用,帮助你掌握这一重要的编程技能。
|
3天前
|
安全 Go 调度
探索Go语言的并发模型:Goroutine与Channel的魔力
本文深入探讨了Go语言的并发模型,不仅解释了Goroutine的概念和特性,还详细讲解了Channel的用法和它们在并发编程中的重要性。通过实际代码示例,揭示了Go语言如何通过轻量级线程和通信机制来实现高效的并发处理。
|
3天前
|
存储 安全 Go
Go语言切片:从入门到精通的深度探索###
本文深入浅出地剖析了Go语言中切片(Slice)这一核心概念,从其定义、内部结构、基本操作到高级特性与最佳实践,为读者提供了一个全面而深入的理解。通过对比数组,揭示切片的灵活性与高效性,并探讨其在并发编程中的应用优势。本文旨在帮助开发者更好地掌握切片,提升Go语言编程技能。 ###
|
4月前
|
数据库 Python
Python网络数据抓取(8):正则表达式
Python网络数据抓取(8):正则表达式
48 2