一、序列化反序列化
1、概念
在前文《网络编程套接字》中,我们实现了服务器与客户端之间的字符串通信,这是非常简单的通信,在实际使用的过程中,网络需要传输的不仅仅是字符串,更多的是结构化的数据(类似于class
,struct
类似的数据)。
那么我们应该怎么发送这些结构化的数据呢?
如果我们直接发送结构化的数据本身,由于内存对齐的规则(默认对齐数)以及操作系统本身的不同等各种原因,就可能导致通信双方对数据的识别是不一致的,从而出现通信错误。
为了解决这种错误,我们就需要定义一种协议,来让双方能够进行正确通信,为此就有了序列化和反序列化。
- 序列化(Serialization):具体来说,序列化是将对象转换为字节序列的过程,以便在网络上传输或者保存在本地文件中。
- 反序列化(Deserialization) :是序列化的逆过程,即把字节序列恢复为对象的过程
例如:
我们可以定义结构体来表示需要交互的信息,发送数据时将这个结构体按照一个规则转换成字符串,接收到数据的时候再按照相同的规则把字符串转化回结构体。这个过程就叫做 “序列化” 和 “反序列化”。
根据某种约定,使一端发送时构造的数据,在另一端能够正确的进行解析。这种约定就是应用层协议。
2、序列化作用
- 数据交换:序列化可以将数据转换为跨平台兼容的格式,使得数据可以在不同的系统、编程语言之间进行交换和共享。
- 持久化存储:将对象序列化后,可以将其保存到磁盘、数据库等介质中,实现数据的持久化存储,防止程序退出或计算机宕机导致数据丢失。
- 网络通信:在网络通信中,可以将对象序列化后通过网络发送到其他计算机,接收端再进行反序列化,从而实现数据的传输和共享。
- 缓存优化:序列化后的数据可以被缓存,当需要时直接从缓存中读取,避免了频繁的数据库查询,提高了性能。
总的来说,序列化方便了数据的传输、保存和共享,同时还可以提高程序的性能和响应速度。
3、序列化框架的选择
在选择序列化和反序列化框架的时候,主要从以下两个方面进行考虑:
- 结果数据大小; 原则上来说,序列化后的数据越小,传输效率越高;
- 结构复杂程度;结构复杂度会影响序列化和发序列化的效率,结构越复杂,越耗时。
根据以上两点,对于性能要求不是太高的服务器程序,可以选择Json
文本格式的序列化框架;对于性能要求比较高的程序程序,则应该选择传输效率更高的二进制序列化框架,建议使用Protobuf
。
二、Json
1、介绍
Json
(JavaScript Object Notation JS对象)是一种轻量级的数据交换格式,采用完全独立于编程语言的文本格式来存储和表示数据。
Json 协议是一种文本协议,易于阅读和编写,同时也易于机器解析和生成,并能有效地提升网络传输协效率,在JSON中,数据以键值对的方式表示,键是一个字符串,值可以是字符串、数字、布尔值、数组、对象或null。简单的JSON示例如下:
{ "name": "张三", "age": 25, "gender": "男" }
JSON格式具有以下特点:
- 可读性高:JSON使用简洁明了的文本格式,易于人类阅读和理解。
- 轻量级:相较于其他数据交换格式如XML,JSON的数据表示更为紧凑,占用更少的存储空间和传输带宽。
- 平台无关性:JSON格式在不同的编程语言和平台之间具有良好的兼容性,可以方便地进行数据交换和共享。
- 支持多种数据类型:JSON支持包括字符串、数字、布尔值、数组、对象和null在内的多种数据类型。这使得JSON能够灵活地表示各种数据结构和复杂对象。
- 易于解析和生成:绝大多数编程语言都提供了JSON的解析和生成库,使得操作JSON数据变得十分方便和高效。
- 可扩展性:JSON格式支持通过嵌套和组合来表示更复杂的数据结构,可以根据具体需求进行扩展和定制。
2、简单使用
例如在CentOs
环境中C++
想使用Json需要先安装jsoncpp
的第三方库:
sudo yum install -y jsoncpp-devel
jsoncpp
的头文件会被安装在系统的 /usr/include/
路径下。
动静态库被安装在 /lib64/
路径下。
在实际使用是,我们只需要包含json.h
头文件就行了
#include <jsoncpp/json/json.h>
在编译链接时,我们要链接jsoncpp
的动态库
-l jsoncpp
Jsoncpp
中的部分成员:
Value
:一种万能对象,能接收任意的kv
类型,进行数据映射。FastWriter
:是用来进行快速序列化,直接把数据序列化为一行字符串。StyledWriter
:进行风格化的序列化,使字符串具有一定的格式更加美观。Reader
:用来进行反序列化。
例如我们下面的需求是一个网络版本的计算器,客户端进行发送计算任务,服务端进行计算,我们使用jsoncpp
来进行传输数据的序列化和反序列化。
- 客户端有三个数据:
_x
(左操作数)_y
(右操作数 )_op
(操作符) - 服务端有两个数据:
_result
(结果),_code
(计算结果的合法性,0表示正确,非零表示各种错误)
// 客户端请求 struct Request { Request() :_x(0), _y(0), _op('+') {} Request(int x, int y, char op) :_x(x), _y(y), _op(op) {} // 序列化 :struct --> string void Serialize(std::string* outstr) { Json::Value root; //万能对象,接收任意类型。 // 构建数据的映射关系 root["x"] = _x; root["y"] = _y; root["op"] = _op; // 序列化 Json::FastWriter writer; *outstr = writer.write(root); } // 反序列化 : string -->struct bool Deserialize(const std::string& instr) { Json::Value root; // 反序列化 Json::Reader reader; reader.parse(instr, root); // 提取映射的数据 _x = root["x"].asInt(); _y = root["y"].asInt(); _op = root["op"].asInt(); return true; } public: int _x; int _y; char _op; }; // 服务端响应 struct Response { Response() :_result(0), _code(0) {} // 序列化 :struct --> string void Serialize(std::string* outstr) { Json::Value root; // 构建数据的映射关系 root["result"] = _result; root["code"] = _code; // 序列化 Json::FastWriter writer; *outstr = writer.write(root); } // 反序列化 :string -->struct bool Deserialize(const std::string& instr) { // 反序列化 Json::Value root; Json::Reader reader; reader.parse(instr, root); // 提取映射的数据 _result = root["result"].asInt(); _code = root["code"].asInt(); return true; } public: int _result; int _code; };