一次彻底搞透协议设计(没做过通讯底层也没有关系)!

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介: 系统设计,协议先行。

大部分人不了解协议的设计细节,更多使用已有协议进行应用层设计,例如:

(1)使用HTTP,设计get/post/cookie参数,以及json包格式;

(2)使用dubbo,而不用去深究内部的二进制包头包体细节;

无论如何,了解协议设计的原则,对深入理解系统通信非常有帮助。

一、协议的分层设计
所谓“协议”,是双方共同遵守的规则,例如:离婚协议,停战协议。协议有语法、语义、时序三要素:
(1)语法,即数据与控制信息的结构或格式;
(2)语义,即需要发出何种控制信息,完成何种动作以及做出何种响应;
(3)时序,即事件实现顺序的详细说明;

画外音:后文主要讲语法设计。

协议设计通常分为三层:应用层协议、安全层协议、传输层协议。
image.png

下面分别看下这三层的协议应该如何选型。

二、应用层协议设计

应用层协议选型,常见的有三种:文本协议、二进制协议、流式XML协议。

文本协议

文本协议是指“贴近人类书面语言表达”的通讯传输协议,典型的协议是HTTP协议,一个HTTP协议的请求报文样例如下:

GET / HTTP/1.1
User-Agent: curl
Host: musicml.net
Accept: */*

文本协议的特点是:
(1)可读性好,便于调试;
(2)扩展性较好,能通过key:value扩展;
(3)解析效率不高,一行一行读入,按照冒号分割,解析key和value;
(4)对二进制不友好 ,比如语音/视频等;

二进制协议
二进制协议即binary协议,典型是IP协议,以下是IP协议的一个图示:
image.png

二进制协议一般包含:

(1)定长包头

(2)可扩展变长包体

(3)一般每个字段有固定的含义,以IP协议为例,前4个bit表示协议版本号(Version);

二进制协议的特点是:

(1)可读性差,难于调试;

画外音:打日志一般需要一个toString()函数增强可读性。

(2)扩展性不好,如果要扩展字段,旧版协议就不兼容了,所以设计时一般会有一个Version字段;
(3)解析效率超高,几乎没有解析代价,二进制流的每个字段表示固定含义;
(4)天然支持二进制流 ,比如语音/视频;

这是一个典型的16字节二进制定长包头的例子:

//sizeof(cs_header)=16
struct cs_header {
  uint32_t version;
  uint32_t magic_num;
  uint32_t cmd;
  uint32_t len;
  uint8_t data[];
}__attribute__((packed));

其中:

(1)前4个字节表示版本号version;

(2)接下来4个字节表示魔法数字magic_num,用来解决数据错位或丢包问题;

画外音:例如,约定好魔法数字是0x01020304,收到的报文,魔法数字匹配,认为是正常报文,否则认为是报文异常,断开连接。

(3)接下来4个字节表示命令号command,不同的命令号对应不同的变长包体;
(4)最后4个字节表示包体长度length,以确定变长包体有多少字节;

这是一个实际的二进制变长包体:

message CUserLoginReq {
  optional string username = 1;
  optional string passwd = 2;
}



message CUserLoginResp {
  optional uint64 uid =1;
}

它使用的是Google的Protobuf协议,容易看到:

(1)请求报文传入的是用户名与密码;

(2)响应包返回的是用户的uid;

PB是很流行的二进制变长包体协议,其优点为:
(1)通用,可以生成C++、Java、PHP等多语言代码;

(2)自带压缩功能;

(3)对二进制友好;

(4)在工业界已广泛应用;

流式XML协议
流式XML似乎是文本协议的一个特例,亦可以单独作为一类。例如:xmpp就是典型的流式XML协议,下面是xmpp协议的一个典型报文:

<message

to=’romeo@example.net’

from=’juliet@example.com’

type=’chat’

xml : lang=’en’>

<body>Wherefore art thou, Romeo?</body>

</message>

从xml标签中大致可以判断这是一个romeo发给juliet的聊天消息。

XML协议有几个特点:
(1)可读性好,扩展性好,这是XML的特性;
(2)解析代价超高,需要进行dom树分析;

(3)有效数据传输率超低,有大量的标签;

(4)对二进制不友好 ,比如语音/视频等;

三、安全层协议设计

安全层协议设计,除了使用SSL,自行实现的话,常见的又有以下三种方案。

画外音:SSL秘钥管理是个问题。

固定密钥
服务端和客户端约定好一个密钥,同时约定好一个加密算法(例如:AES),每次客户端发送报文前,就用约定好的算法,以及约定好的密钥加密再传输,服务端收到报文后,用约定好的算法,约定好的密钥再解密。

画外音:安全性低,安全性基于程序员的职业操守。

一人一密
简单来说,就是一个人的密钥是固定的,但是每个人之间又不同。常见的实现方式是:

(1)固定加密算法;

(2)加密秘钥使用“用户的某一特殊属性”,比如用户uid、手机号、qq号、用户密码等;

一次一密
即动态密钥,一Session一密钥的安全性更高,每次会话前协商密钥。密钥协商的过程要经过2次非对称密钥的随机生成,1次对称加密密钥的随机生成,具体详情这里不展开。

四、传输层协议设计
可选的协议有TCP和UDP,现在基本都是使用TCP,有了epoll等技术后,多连接就不是瓶颈了,单机几十万链接没什么问题。

本文转自“架构师之路”公众号,58沈剑提供。

目录
相关文章
|
8月前
|
缓存 网络协议 数据库连接
【底层服务/编程功底系列】「网络通信体系」深入探索和分析TCP协议的运输连接管理的核心原理和技术要点
【底层服务/编程功底系列】「网络通信体系」深入探索和分析TCP协议的运输连接管理的核心原理和技术要点
110 0
|
NoSQL 数据建模 API
UCX-UCT统一通信传输层3-服务端和客户端调用栈详解(及相关)_源码解读
主流程(服务端或客户端): 1. 主函数中解析命令行参数(parse_cmd), 设置默认服务端口 2. 初始化上下文(ucs_async_context_create, 异步事件上下文用于管理定时器和FD通知), 在其中, 初始化多生产者/多消费者队列(ucs_mpmc_queue_init), 初始化非阻塞异步轮询器(ucs_async_poll_init), 初始化可重入自旋锁上下文等 3. 创建工人(uct_worker_create), 工人代表着 progress 的引擎。 可以在应用程序中创建多个进度引擎,例如供多个线程使用 4. 根据入参查找期望的传输层(dev_tl_loo
378 1
|
芯片
一文搞懂I2C协议-硬件基础
I2C总线是由飞利浦在80年代初设计的,以允许位于同一电路板上的组件之间能够轻松通信。其大大简化了电路的设计,早期的电视机中很多地方用到了I2C这种通信方式。飞利浦半导体于2006年迁移到了NXP。I2C名称翻译为“ Inter IC”。有时,该总线称为IIC或I²C总线。I2C总结的基本的特征
1206 0
|
网络安全 开发工具 数据安全/隐私保护
建立一个流式的RPC通信 | 青训营笔记
建立一个流式的RPC通信 | 青训营笔记
235 0
数据通信系统一些概念
数据通信系统一些概念
138 0
数据通信系统一些概念
|
存储 边缘计算 缓存
带你读《思科软件定义访问 : 实现基于业务意图的园区网络》第二章软件定义访问体系结构2.3(二)
《思科软件定义访问 : 实现基于业务意图的园区网络》第二章软件定义访问体系结构2.3(二)
带你读《思科软件定义访问 : 实现基于业务意图的园区网络》第二章软件定义访问体系结构2.3(二)
|
运维 BI 定位技术
带你读《思科软件定义访问 : 实现基于业务意图的园区网络》第二章软件定义访问体系结构2.5(六)
带你读《思科软件定义访问 : 实现基于业务意图的园区网络》第二章软件定义访问体系结构2.5
带你读《思科软件定义访问 : 实现基于业务意图的园区网络》第二章软件定义访问体系结构2.5(六)
|
数据挖掘 5G 调度
前传感知的协作传输和接收之下行链路 | 带你读《5G系统关键技术详解》之十三
在当前的 3G/4G 蜂窝网络中,每个被调度的用户由一个基站服务并且接收到来自所 有相邻基站的干扰。C-RAN 架构的优点来自多个 RRH 协同服务用户的能力,从而小化干扰的影响。
前传感知的协作传输和接收之下行链路 | 带你读《5G系统关键技术详解》之十三
|
数据格式 XML 数据安全/隐私保护
|
JSON 算法 网络协议
Java编程架构深入解析-RPC 消息协议设计
本节我们开始讲解 RPC 的消息协议设计背后的基本原理,了解 RPC 的协议开发背后有哪些需要考虑的基本点。在通晓原理之后,我们就可以自己设计一套协议来开发属于自己的 RPC 系统。
1590 0

热门文章

最新文章