Go语言实战案例-统计文件中每个字母出现频率

简介: 《Go语言100个实战案例》中的“文件与IO操作篇 - 案例19”教你如何统计文本文件中每个英文字母的出现频率。通过实战练习,掌握文件读取、字符处理、map统计等基础技能,适合Go语言初学者提升编程能力。

 

以下是《Go语言100个实战案例》中的 文件与IO操作篇 - 案例19:统计文件中每个字母出现频率 的完整内容。本案例适合用来练习文件读取、字符处理、map统计等基础技能。

🎯 案例目标

读取一个本地文本文件,统计并打印出其中每个英文字母(忽略大小写)出现的次数和频率。


🧩 应用场景

  • • 文本分析、自然语言处理前的预处理
  • • 编写字频统计工具
  • • 简化数据分析或可视化处理的前置步骤

🧠 涉及知识点

  • • 使用 os.Open() 读取文件
  • bufio.Scanner 按行读取
  • • 字符串遍历与判断
  • • 使用 map[rune]int 统计频率
  • • 转换大小写 unicode.ToLower

💻 示例代码:统计字母频率

package main
import (
    "bufio"
    "fmt"
    "os"
    "unicode"
)
func main() {
    filePath := "sample.txt"
    // 打开文件
    file, err := os.Open(filePath)
    if err != nil {
        fmt.Println("无法打开文件:", err)
        return
    }
    defer file.Close()
    // 用于存储每个字母出现的次数
    frequency := make(map[rune]int)
    totalLetters := 0
    scanner := bufio.NewScanner(file)
    for scanner.Scan() {
        line := scanner.Text()
        for _, ch := range line {
            if unicode.IsLetter(ch) {
                ch = unicode.ToLower(ch)
                frequency[ch]++
                totalLetters++
            }
        }
    }
    // 打印结果
    fmt.Println("字母频率统计:")
    for ch := 'a'; ch <= 'z'; ch++ {
        count := frequency[ch]
        if count > 0 {
            percentage := float64(count) / float64(totalLetters) * 100
            fmt.Printf("%c: %d (%.2f%%)\n", ch, count, percentage)
        }
    }
}

📂 示例文本内容(sample.txt)

Go is expressive, concise, clean, and efficient.
Its concurrency mechanisms make it easy to write programs.

📤 执行结果示例

字母频率统计:
a: 5 (4.85%)
c: 7 (6.80%)
d: 2 (1.94%)
e: 10 (9.71%)
f: 2 (1.94%)
g: 1 (0.97%)
...
t: 8 (7.77%)
w: 1 (0.97%)

🛠 技术说明

函数 说明
os.Open() 打开文件
bufio.NewScanner() 按行扫描文本
unicode.IsLetter() 判断字符是否为英文字母
unicode.ToLower() 转换为小写字母以便统计统一
map[rune]int 使用字符为键的字典进行计数

🧪 拓展练习

  • • 统计所有字符(包括数字、标点)
  • • 按频率从高到低排序输出
  • • 将结果保存为 CSV 或 JSON 文件
  • • 添加参数选择分析哪个文件或字母范围(如大写、小写)

✅ 小结

这个案例帮助你掌握了如何在 Go 中进行文本分析,特别是字母频率统计。这是数据清洗和自然语言处理中的常见需求。


 

相关文章
|
1月前
|
存储 监控 算法
防止员工泄密软件中文件访问日志管理的 Go 语言 B + 树算法
B+树凭借高效范围查询与稳定插入删除性能,为防止员工泄密软件提供高响应、可追溯的日志管理方案,显著提升海量文件操作日志的存储与检索效率。
83 2
|
2月前
|
Linux Go iOS开发
Go语言100个实战案例-进阶与部署篇:使用Go打包生成可执行文件
本文详解Go语言打包与跨平台编译技巧,涵盖`go build`命令、多平台构建、二进制优化及资源嵌入(embed),助你将项目编译为无依赖的独立可执行文件,轻松实现高效分发与部署。
|
3月前
|
数据采集 数据挖掘 测试技术
Go与Python爬虫实战对比:从开发效率到性能瓶颈的深度解析
本文对比了Python与Go在爬虫开发中的特点。Python凭借Scrapy等框架在开发效率和易用性上占优,适合快速开发与中小型项目;而Go凭借高并发和高性能优势,适用于大规模、长期运行的爬虫服务。文章通过代码示例和性能测试,分析了两者在并发能力、错误处理、部署维护等方面的差异,并探讨了未来融合发展的趋势。
313 0
|
2月前
|
存储 前端开发 JavaScript
Go语言实战案例-项目实战篇:编写一个轻量级在线聊天室
本文介绍如何用Go语言从零实现一个轻量级在线聊天室,基于WebSocket实现实时通信,支持多人消息广播。涵盖前后端开发、技术选型与功能扩展,助你掌握Go高并发与实时通信核心技术。
|
3月前
|
负载均衡 监控 Java
微服务稳定性三板斧:熔断、限流与负载均衡全面解析(附 Hystrix-Go 实战代码)
在微服务架构中,高可用与稳定性至关重要。本文详解熔断、限流与负载均衡三大关键技术,结合API网关与Hystrix-Go实战,帮助构建健壮、弹性的微服务系统。
453 1
微服务稳定性三板斧:熔断、限流与负载均衡全面解析(附 Hystrix-Go 实战代码)
|
1月前
|
存储 安全 Java
【Golang】(4)Go里面的指针如何?函数与方法怎么不一样?带你了解Go不同于其他高级语言的语法
结构体可以存储一组不同类型的数据,是一种符合类型。Go抛弃了类与继承,同时也抛弃了构造方法,刻意弱化了面向对象的功能,Go并非是一个传统OOP的语言,但是Go依旧有着OOP的影子,通过结构体和方法也可以模拟出一个类。
144 1
|
3月前
|
Cloud Native 安全 Java
Go:为云原生而生的高效语言
Go:为云原生而生的高效语言
283 1
|
3月前
|
Cloud Native Go API
Go:为云原生而生的高效语言
Go:为云原生而生的高效语言
358 0
|
3月前
|
Cloud Native Java Go
Go:为云原生而生的高效语言
Go:为云原生而生的高效语言
230 0
|
3月前
|
Cloud Native Java 中间件
Go:为云原生而生的高效语言
Go:为云原生而生的高效语言
211 0