1. 为什么需要序列化和反序列化协议
我们要传输这样一个对象,里面的变量有些是数组形式(languages),有些又还是对象(phone),有些还是数组对象(books)。
name: 姓名, 比如darren age: 年龄,比如80 languages: 熟悉的编程语言, 普通数组方式,比如["C++", "Linux"], phone: 电话号码,是嵌套的对象,包含number和type, 比如"number": "18570368134", "type": "home books: 对象数组方式,可以包含多本书信息, 每本书包含name和price属性。 vip: 是否为vip, 比如true address: 地址, 比如"yageguoji"
此时我们要将对象从客户端传输到服务器,那应该怎么传输,定义一个person对象,在描述完起成员变量将这个对象占用的内存发送给服务器?比如:
//简单伪代码 Person p1; 封装p1; 然后send(&p1, sizeof(p1).)
这样肯定不行的。比如 languages可能是"C",也可能是是"C++",“Linux”,此时我们sizeof(p1)是固定还是不固定?假如不固定那服务器怎么解析出一个Person来?
既然不能直接传对象,那怎么办?这时候序列化协议就发挥作用了。
2. 序列化和反序列化基础
- 序列化(serialization)就是将对象序列化为二进制形式(字节数组),一般也将序列化称为编码(Encode),主要用于网络传输、数据持久化等;
- 反序列化(deserialization)则是将从网络、磁盘等读取的字节数组还原成原始对象,以便后续业务的进行,一般也将反序列化称为解码(Decode),主要用于网络传输对象的解码,以便完成远程调用。
序列化:把对象转换为字节序列的过程称为对象的序列化。
反序列化:把字节序列恢复为对象的过程称为对象的反序列化。
3. 什么情况需要序列化
- 当你想把的内存中的对象状态保存到一个文件中或者数据库中时候;
- 当你想用套接字在网络上传送对象的时候。
4. 主流序列化协议:xml, json, protobuf
|xml| 通用| 重量级| 文本格式|
|json|通用| 轻量级| 文本格式|
|prottobuf |独立 |轻量级|二进制|
- 通用:协议是标准的,不同的第三方软件都可以相互进行序列化和反序列化,比如使用cjson序列化后的数据,可以使用jsoncpp反序列化。
- 独立:标准是私有的,比如protocol buffer协议,目前只有Google自家支持。
- 文本格式:可以看出内容的具体文字含义
- 二进制格式:纯数值的数据,可读性不强。比如protobuf序列化后的数据。
速度测试和序列化后数据大小对比
测试10万次序列化
测试10万次反序列化
参看链接: