Go来合并两个csv

简介: Go来合并两个csv

背景


通常我们处理文件都是用python+pandas,确实很香。但是今天突然有人找我用go写一个合并两个csv文件的,需要将两个csv按id进行合并,大致如下图


image.png

image.png

思路很简单,先读入两个csv文件,然后遍历比较id,如果相同就把另一个文件的内容加到第一个中。然后创建merge.csv,将上一步得到的数据写入csv即可。


代码部分


package main
import (
  "encoding/csv"
  "log"
  "os"
  "fmt"
)
func join(fileName1 string, fileName2 string) (row [][]string) {
  fs1, _ := os.Open(fileName1)
  r1 := csv.NewReader(fs1)
  content1, err := r1.ReadAll()
  if err != nil {
    log.Fatalf("can not readall, err is %+v", err)
  }
  fs2, _ := os.Open(fileName2)
  r2 := csv.NewReader(fs2)
  content2, err := r2.ReadAll()
  if err != nil {
    log.Fatalf("can not readall, err is %+v", err)
  }
  row = make([][]string, len(content1[1:]))
  for i, row1 := range content1[1:] {
    for _, row2 := range content2[1:] {
      if row1[0] == row2[0] {
        row[i] = append(row[i], row1[0], row1[1], row1[2], row2[1], row2[2])
      }
    }
  }
  return
}
func edit(filename string, row [][]string) {
  f, err := os.Create(filename)
  if err != nil {
    panic(err)
  }
  defer f.Close()
  //防止乱码
  f.WriteString("\xEF\xBB\xBF")
  w := csv.NewWriter(f)
  w.Write([]string{"ID", "name", "gender", "course", "score"})
  w.WriteAll(row)
  w.Flush()
}
func main() {
  row := join("1.csv", "2.csv")
  fmt.Println(row)
  edit("join.csv", row)
  fmt.Println("合并已完成!")
}
复制代码


image.png

image.png

优化


对于小数据量这样是没有问题,但是一旦数据量增大,不仅读取的内存占用增加,而且遍历比较会很消耗时间。所以优化的话我们可以以行读取,并且想办法使用go的goroutine来增加速度。唉,太久没怎么写go了,一开始切片都有点忘了,最近准备写一些关于go的内容,所以开始从头复习一遍go相关的知识,后期会攒起来慢慢发。

目录
相关文章
|
Go
Go学习笔记(三) 学会使用GO标准库,以CSV库为例
CSV读取 标准库提供了一系列实用函数的API,让我们避免重复造轮子. 为了学会使用一个已有的轮子,我们需要学看文档。Go所有标准库文档都放在https://golang.org/pkg/, 假如我们想读取一个CSV文件, 我们就需要学习csv包的用法。
1204 0
|
1天前
|
IDE Linux Go
记录一个go语言与IDE之间的问题
【7月更文挑战第1天】本文介绍在IDE中调试Go应用可能遇到的问题。当问题与IDE的自动完成有关,可以试着使用其他编辑器如Linux的vim是否无此问题。这可以验证表明IDE可能不完全兼容最新语言版本,建议使用无自动检测工具临时解决。
16 0
|
1天前
|
安全 Go
Go语言的iota关键字有什么用途?
**Go语言中的`iota`是常量生成器,用于在`const`声明中创建递增的常量。`iota`在每个新的`const`块重置为0,然后逐行递增,简化了枚举类型或常量序列的定义。例如,定义星期枚举:** ```markdown ```go type Weekday int const ( Sunday Weekday = iota // 0 Monday // 1 Tuesday // 2 ... ) ``` 同样,`iota`可用于定义不同组的常量,如状态码和标志位,保持各自组内的递增,提高代码可读性。
|
3天前
|
JSON 算法 测试技术
在go语言中调试程序
【6月更文挑战第29天】Go语言内置`testing`包支持单元测试、基准测试和模糊测试。`go test`命令可执行测试,如`-run`选择特定测试,`-bench`运行基准测试,`-fuzz`进行模糊测试。
16 2
在go语言中调试程序
|
5天前
|
编译器 Go C++
必知的技术知识:go语言快速入门教程
必知的技术知识:go语言快速入门教程
|
6天前
|
编译器 Go 开发者
|
6天前
|
Devops Go 云计算
Go语言发展现状:历史、应用、优势与挑战
Go语言发展现状:历史、应用、优势与挑战
|
7天前
|
Go
go语言map、实现set
go语言map、实现set
13 0
|
7天前
|
Go
go语言数组与切片
go语言数组与切片
16 0
|
7天前
|
Go
go语言的hello,world
go语言的hello,world
10 1