Pipeline

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
简介: 如果遇到大量的批处理,我们可以考虑使用Redis的pipeline(管道)

1、简介

Redis是一种基于客户端-服务端模型以及请求/响应的TCP服务。一次Redis客户端发起的请求,经过服务端的响应后,大致会经历如下的步骤:

  1. 客户端发起一个(查询/插入)请求,并监听socket返回,通常情况都是阻塞模式等待Redis服务器的响应
  2. 服务端处理命令,并且返回处理结果给客户端
  3. 客户端接收到服务的返回结果,程序从阻塞代码处返回

Redis客户端和服务端之间通过网络连接进行数据传输,这个连接可以很快(loopback接口)或很慢(建立了一个多次跳转的网络连接)。无论网络延如何延时,数据包总是能从客户端到达服务器,并从服务器返回数据回复客户端,这个时间被称之为RTT(Round Trip Time - 往返时间)。我们可以很容易就意识到,Redis在连续请求服务端时,即使Redis每秒能处理100k请求,但也会因为网络传输花费大量时间,导致整体性能的下降。

因此如果遇到大量的批处理,我们可以考虑使用Redis的pipeline(管道)。值得注意的是,管道技术并不是Redis特有的技术,管道技术往往需要客户端-服务器的共同配合,大部分工作任务其实是在客户端完成,很显然Redis支持管道技术,按照官网的意思,Redis的最低版本就考虑了管道技术的支持性设计。

如下图,多个连续的incr指令,使用pipeline(管道)后,多个连续的incr指令只会花费一次网络来回开销,这个开销会随着n数值的增大,大幅减少网络io开销,从而提升整体服务的性能。


2、深究pipeline

在上述简介中,提到了管道技术优化的是网络传输的耗时时间,这里通过Redis客户端-服务端的一次完整的网络请求来回,深入探索pipeline的本质。

  1. 客户端调用write将数据写入操作系统内核(kernel)为socket连接分配的发送缓冲区(send buffer)
  2. 客户端操作系统内核将发送缓冲区(send buffer)的数据发送到网卡(NIC)
  3. 网卡(NIC)将数据通过路由(route)将数据送到Redis服务器机器网卡(NIC)
  4. 服务器操作系统内核(kernel)将网卡(NIC)接收的数据,写入内核为socket分配的接收缓冲区(recv buffer)
  5. 服务器进程从接收缓冲区调用read读取数据,并进行数据逻辑处理
  6. 数据处理完成之后,服务器进程调用write将响应数据写入操作系统内核为socket分配的发送缓冲区
  7. 操作系统内核将发送缓冲区的数据发送到服务器网卡
  8. 服务器网卡将响应数据通过路由发送到客户端网卡
  9. 客户端网卡接收响应数据
  10. 客户端操作系统内核读取网卡接收到的服务器响应数据,并写入操作系统为socket连接分配的介绍缓冲区
  11. 客户端进程调用read从接收缓冲区中读取服务器响应数据
  12. 一次完整网络请求来回过程结束

对于pipeline技术而言,就是将n * 12个步骤,合并成1 * 12,这样服务请求响应的总体时间将会大大的减少。


有个值得注意的点:

在上述网络请求来回中,可能出现我们经常说到的io阻塞:

  1. 当write操作发生,并且发送缓冲区(send buffer)满时,就会导致write操作阻塞
  2. 当read操作发生,并且接收缓冲区(recv buffer)满时,就会导致read操作阻塞

上述的这两个阻塞如果出现,将会导致整个请求时间变长,因此我们操作大批量指令的时候,比如10k个指令,我们可以合理的对指令分多次批量发送,这样可以减少出现阻塞的情况,也可以避免服务器响应一个过大的答复包,导致客户端内存负载过重。

3、benchmark压测pipeline

使用Redis提供的benchmark对Redis进行性能测试,

如过你是Windows下的Redis,在安装目录下有个redis-benchmark.exe,进入cmd命令模式测试即可

如果你是在Linux下的redis,在安装目录的src目录下有个redis-benchmark

redis-benchmark的全部指令参数如下所示,我们这里测试pipeline,需要使用-P

指令名称

描述

默认值

-h

指定Redis服务器hostname

127.0.0.1

-p

指定Redis服务器端口

6379

-s

指定Redis服务器Server Socket

-a

指定Redis服务器密码

-c

指定客户端并发数

50

-n

指定总请求数

100000

-dbnum

指定Redis数据库

0

-k

1=keep alive 0=reconnect

1

-r

使用随机key,value 对相关指令进行压测

-P

使用管道(pipeline)

1(no pipeline)

-q

强制退出Redis,仅展示query/sec

--csv

使用CSV格式输出

-l

循环运行测试

-t

运行逗号分隔的测试列表

-I

Idle模式,仅打开N个idle连接并等待

通过普通方式测试set指令和pipeline方式测试set指令,可以看到Redis服务不同的QPS:

  • 普通set方式,Redis QPS 大概在5.3万左右
  • 当使用pipeline set时,随着管道内并行请求数量的增加,Redis QPS可以达到100万以上


4、Jedis使用pipeline

测试代码

package com.liziba.redis;


import redis.clients.jedis.Jedis;

import redis.clients.jedis.Pipeline;


import java.io.IOException;


/**

* <p>

* 测试pipeline

* </p>

*

* @Author: Liziba

* @Date: 2021/9/14 22:43

*/

public class PipelineTest {


   public static void main(String[] args) throws IOException {

       Jedis client = new Jedis("127.0.0.1", 6379);


       long startPipe = System.currentTimeMillis();

       Pipeline pipe = client.pipelined();

       pipe.multi();

       for (int i = 0; i < 100000; i++) {

           pipe.set("pipe" + i, i + "" );

       }

       pipe.exec();

       pipe.close();

       long endPipe = System.currentTimeMillis();

       System.out.println("pipeline set cost time : " + (endPipe - startPipe) + "ms");



       for (int i = 0; i < 100000; i++) {

           client.set("normal" + i, i + "");

       }

       System.out.println("normal set cost time : " + (System.currentTimeMillis() - endPipe)+ "ms");

   }


}

测试结果


相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore &nbsp; &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
打赏
0
0
0
0
10
分享
相关文章
Jenkins Pipeline 参数化构建
Jenkins Pipeline 参数化构建
328 0
Pipeline基础语法
Pipeline是处理数据流和构建机器学习模型的重要工具,它能够简化代码、提高可读性并减少错误。通过本篇文章,读者应能掌握Pipeline的基本语法、使用方法及其在数据科学中的重要性。正确使用Pipeline将极大地提高机器学习项目的效率与可靠性。希望本文能为您的数据处理工作提供实用的指导和帮助。
30 9
基于LoongCollector构建全新可观测Pipeline
LoongCollector是阿里云推出的下一代可观测数据管道,旨在融合多种采集技术,构建统一的可观测数据代理。它具备高性能、可靠性和灵活性,支持日志、指标和追踪等多类型数据采集。通过模块化设计和SPL处理引擎,LoongCollector实现了高效的数据处理与传输,并大幅简化了配置管理。此外,集成eBPF技术,提供无侵入、高性能的应用性能监控,适用于复杂异构环境。未来,LoongCollector将继续优化性能、探索AI赋能的智能化采集。
Jenkins Pipeline 流水线 - 完整构建 Pipeline Script 脚本
Jenkins Pipeline 流水线 - 完整构建 Pipeline Script 脚本
141 0
Jenkins Pipeline 流水线 - Parameters 参数化构建
Jenkins Pipeline 流水线 - Parameters 参数化构建
190 0
Jenkins Pipeline 流水线 - withCredentials 使用
Jenkins Pipeline 流水线 - withCredentials 使用
178 0
浅析sklearn中的Pipeline
为什么需要Pipeline? 在日常机器学习项目开发中,可能会经过数据缩放、特征组合以及模型学习拟合等过程;并且,当问题更为复杂时,所应用到的算法以及模型则较为繁杂。
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等