自古以来,JSON序列化就是兵家必争之地

简介: 1.ioutil.ReadAll 读取大的response.body的风险:性能差且有内存泄漏的风险。2.隐式内存泄漏:对于高并发、长时间运行的web程序,不及时释放内存最终也会导致内存耗尽。3.json 序列化是兵家必争之地, json-iterator 是兼容标准encode/json api 用法的高性能序列化器。4.pprof 内存诊断的姿势 & 调试指标的意义。

01

前人引路


Stackoverflow[1]morganbaz的看法是:


使用iotil.ReadAll去读取go语言里大的Response Body,是非常低效的; 另外如果Response Body足够大,还有内存泄漏的风险。


data,err:=  iotil.ReadAll(r)
if err != nil {
  return err
}
json.Unmarshal(data, &v)


有一个更有效的方式来解析json数据,会用到Decoder类型


err := json.NewDecoder(r).Decode(&v)
if err != nil {
    return err
}


这种方式从内存和时间角度,不但更简洁,而且更高效。


Decoder不需要分配一个巨大的字节内存来容纳数据读取——它可以简单地重用一个很小的缓冲区来获取所有的数据并渐进式解析。这为内存分配节省了大量时间,并消除了GC的压力


JSON Decoder可以在第一个数据块进入时开始解析数据——它不需要等待所有东西完成下载。


02

后人乘凉


我针对前人的思路补充两点。


①.官方ioutil.ReadAll是通过初始大小为512字节的切片来读取reader,我们的response body大概50M, 很明显会频繁触发切片扩容,产生不必要的内存分配,给gc也带来压力。


go切片扩容的时机:需求小于256字节,按照2倍扩容;超过256字节,按照1.25倍扩容。

   

② .怎么理解morganbaz所说的带来的内存泄漏的风险?


内存泄漏是指程序已动态分配的堆内存由于某种原因未释放,造成系统内存浪费,导致程序运行速度减慢升职系统崩溃等严重后果。


ioutil.ReadAll读取大的Body会触发切片扩容,讲道理这种做法只会带来内存浪费,最终会被gc释放,原作者为什么会强调有内存泄漏的风险?


我咨询了一些童靴,对于需要长时间运行的高并发服务器程序,不及时释放内存也可能导致最终耗尽系统所有内存,这是一种隐式内存泄漏


03

JSON序列化是兵家必争之地


morganbaz大佬提出使用标准库encoding/json来边读边反序列化, 减少内存分配, 加快反序列化速度。


自古以来,JSON序列化就是兵家必争之地[2],各大语言内部均对序列化有不同的实现思路,性能相差较大。


下面使用高性能json序列化库json-iterator与原生ioutil.ReadAll+ json.Unmarshal方式做对比。


顺便也检验我最近实践pprof[3]的成果


# go get "github.com/json-iterator/go"
package main
import (
 "bytes"
 "flag"
 "log"
 "net/http"
 "os"
 "runtime/pprof"
 "time"
 jsoniter "github.com/json-iterator/go"
)
var cpuprofile = flag.String("cpuprofile", "", "write cpu profile to file.")
var memprofile = flag.String("memprofile", "", "write  mem profile to file")
func main() {
 flag.Parse()
 if *cpuprofile != "" {
  f, err := os.Create(*cpuprofile)
  if err != nil {
   log.Fatal(err)
  }
  pprof.StartCPUProfile(f)
  defer pprof.StopCPUProfile()
 }
 c := &http.Client{
  Timeout: 60 * time.Second,
  // Transport: tr,
 }
 body := sendRequest(c, http.MethodPost)
 log.Println("response body length:", body)
 if *memprofile != "" {
  f, err := os.Create(*memprofile)
  if err != nil {
   log.Fatal("could not create memory profile: ", err)
  }
  defer f.Close() // error handling omitted for example
  if err := pprof.WriteHeapProfile(f); err != nil {
   log.Fatal("could not write memory profile: ", err)
  }
 }
}
func sendRequest(client *http.Client, method string) int {
    endpoint := "http://xxxxx.com/table/instance?method=batch_query"
   expr := "idc in (logicidc_hd1,logicidc_hd2,officeidc_hd1)"
    var json = jsoniter.ConfigCompatibleWithStandardLibrary
   jsonData, err := json.Marshal([]string{expr})
   log.Println("开始请求:" + time.Now().Format("2006-01-02 15:04:05.010"))
   response, err := client.Post(endpoint, "application/json", bytes.NewBuffer(jsonData))
   if err != nil {
     log.Fatalf("Error sending request to api endpoint, %+v", err)
  }
  log.Println("服务端处理结束, 准备接收Response:" + time.Now().Format("2006-01-02 15:04:05.010"))
  defer response.Body.Close()
   var resp Response
   var records = make(map[string][]Record)
   resp.Data = &records
   err= json.NewDecoder(response.Body).Decode(&resp)
   if err != nil {
    log.Fatalf("Couldn't parse response body, %+v", err)
   }
   log.Println("客户端读取+解析结束:" + time.Now().Format("2006-01-02 15:04:05.010"))
   var result = make(map[string]*Data, len(records))
   for _, r := range records[expr] {
     result[r.Ins.Id] = &Data{Active: "0", IsProduct: true}
   }
   return len(result)
}
# 省略了反序列化的object type


内存对比


非单纯序列化对比,前者对后者优化的效果反馈。


dc998ad39ab213ea2754873b1a2b6619.png


                              --- json-iterator边读 边反序列化 ---


ce3ec55da2cf5a645e6ff93a3dbe9cb8.png


                      --- io.ReadAll + json.Unmarshal 反序列化---


我们可以点进去看io.ReadAll + json.Unmarshal内存耗在哪里?


Total:     59.59MB    59.59MB (flat, cum)   100%
    626            .          .           func ReadAll(r Reader) ([]byte, error) { 
    627            .          .               b := make([]byte, 0, 512) 
    628            .          .               for { 
    629            .          .                   if len(b) == cap(b) { 
    630            .          .                       // Add more capacity (let append pick how much). 
    631      59.59MB    59.59MB                       b = append(b, 0)[:len(b)] 
    632            .          .                   } 
    633            .          .                   n, err := r.Read(b[len(b):cap(b)]) 
    634            .          .                   b = b[:len(b)+n] 
    635            .          .                   if err != nil { 
    636            .          .                       if err == EOF {


从上图也可以印证io.ReadAll  为存储整个Response.Body对初始512字节的切片不断扩容, 产生常驻内存59M。


你还可以对比alloc_space 分配内存(alloc_space、inuse_space 的差值可粗略理解为gc释放的部分)。


699e63f88436315355e79af8ea422d92.png


3ab8e8a06f58431bd05f64fd7aa8c923.png


从结果看json-iterator相比io.ReadAll + json.Unmarshal 动态分配的内存还是比较小的。


04

我的收获


1.ioutil.ReadAll 读取大的response.body的风险:性能差且有内存泄漏的风险。、


2.隐式内存泄漏:对于高并发、长时间运行的web程序,不及时释放内存最终也会导致内存耗尽。


3.json 序列化是兵家必争之地, json-iterator 是兼容标准encode/json api 用法的高性能序列化器。


4.pprof 内存诊断的姿势 & 调试指标的意义。

相关文章
|
1月前
|
JSON Java Maven
使用Jackson进行 JSON 序列化和反序列化
使用Jackson进行 JSON 序列化和反序列化
27 0
|
1月前
|
存储 JSON 安全
序列化模块pickle和json有什么区别
序列化模块pickle和json有什么区别
18 0
|
2月前
|
JSON 数据格式 C++
[序列化协议] --- JSON
[序列化协议] --- JSON
31 0
|
3月前
|
JSON Java fastjson
Java中的JSON序列化和反序列化
Java中的JSON序列化和反序列化
|
3月前
|
JSON 机器人 数据格式
阿里云RPA支持将序列化的JSON数据作为输入参数传递给机器人应用程序
【1月更文挑战第7天】【1月更文挑战第33篇】阿里云RPA支持将序列化的JSON数据作为输入参数传递给机器人应用程序
206 1
|
4月前
|
XML 存储 JSON
C# 对象存储 (轻松实现序列化 | Xml | Json | 加密 | 压缩 | 注册表 | Redis)
开发时经常会遇到需要保存配置的情况,最常见的实现方式是将对象序列化成Json,再写入文件并保存到本地磁盘。 本文将使用开源库**ApeFree.DataStore**来替换原有的对象存储过程,实现一个可以随意切换存储方式的对象存储方法。 ApeFree.DataStore是一款可配置的对象存储库,支持在不同平台/介质中对内存中的对象进行存储与还原(如本地存储、注册表存储)。支持配置序列化格式(如Json、Xml),支持配置压缩算法(如GZip、Defalte),支持配置加密算法(如AES、RSA)。
68 0
C# 对象存储 (轻松实现序列化 | Xml | Json | 加密 | 压缩 | 注册表 | Redis)
|
4月前
|
XML 存储 JSON
C# | 使用Json序列化对象时忽略只读的属性
将对象序列化成为Json字符串是一个使用频率非常高的功能。Json格式具有很高的可读性,同时相较于XML更节省空间。 在开发过程中经常会遇到需要保存配置的场景,比如将配置信息保存在配置类型的实例中,再将这个对象序列化成为Json字符串并保存。当需要加载配置时,则是读取Json格式的字符串再将其还原成配置对象。在序列化的过程中,默认会将所有公开的属性和字段都序列化进入Json字符串中,这其中也会包含只读的属性或字段,而只读的属性和字段在反序列化的过程中其实是无意义的,也就是说这一部分存储是多余的。 本文将讲解如何在执行Json序列化时,忽略掉那些只读的属性和字段。
54 0
C# | 使用Json序列化对象时忽略只读的属性
|
4月前
|
XML JSON 网络协议
JSON和Protobuf序列化
因为像TCP和UDP这种底层协议只能发送字节流,因此当我们在开发一些远程过程调用(RPC)的程序时,需要将应用层的Java POJO对象序列化成字节流,数据接收端再反序列化成Java POJO对象。序列化一定会设计编码和格式化,目前常见的编码方式有:
|
5月前
|
JSON JavaScript 前端开发
c#JSON序列化&反序列化
JSON(全称为JavaScript ObjectNotation) 是一种轻量级的数据交换格式。它是基于JavaScript语法标准的一个子集。JSON采用完全独立于语言的文本格式,可以很容易在各种网络、平台和程序之间传输。JSON的语法很简单,易于人阅读和编写,同时也易于机器解析和生成。
39 0
|
6月前
|
存储 XML JSON
互联网协议必备:Go语言中JSON的序列化与反序列化
互联网协议必备:Go语言中JSON的序列化与反序列化
76 0