库存预占架构升级方案设计 - 交易库存中心

简介: 伴随物流行业的迅猛发展,一体化供应链模式的落地,对系统吞吐、系统稳定发出巨大挑战,库存作为供应链的重中之重表现更为明显。近三年数据可以看出:

背景介绍
伴随物流行业的迅猛发展,一体化供应链模式的落地,对系统吞吐、系统稳定发出巨大挑战,库存作为供应链的重中之重表现更为明显。近三年数据可以看出:

接入商家同比增长 37.64%、货品种类同比增长 53.66%

货品数量同比增长 46.43%、仓库数量同比增长 18.87%

通过分析过往大促流量,分钟级流量增长率为 75%,大促仓内反馈三方订单下传不及时,库存预占吞吐量和性能是导致订单积压因素之一。目前库存使用 mysql 数据库作为接单预占的扛量手段,随着一体化供应链建设以及重点 KA 商家不断接入,现有库存架构在业务支撑上存在风险和缺陷。

此外未来 3 到 5 年业务增长、流量增长预计增长 5-10 倍。为避免系统性能和技术架构缺陷导致业务损失,轻量级库存架构势在必行。

// 名词解释:

库存预占:是指消费者拍下商品订单后,库存先为该订单短暂预留,预留的库存即为预占库存。

架构原则
架构:是⾯向问题,解决问题的手段。 库存系统的问题:非功能性:1. 高并发 2. 系统稳定性 (容灾) 3. 数据一致性 功能性: 1. 业务复杂 2. 数据一致性

系统设计
设计思路
当前库存系统瓶颈在哪里?:抗写流量,数据库成为瓶颈点。
如何解决系统瓶颈?:由高并发组件 Redis 替代数据库。
利用 Redis 需要解决哪些问题?:防超卖,异步写数据库保证最终一致性。

总体设计
扛量部分:库存性能瓶颈在预占,传统架构主要依靠数据库事务保持数据一致以及数据读写;新版架构设计将数据扛量部分移植到 Redis,利用 Redis 高性能吞吐解决高并发场景下数据读写。
数据回写:Redis 进行扛量削峰,后续数据仅用于记账,最终牺牲数据的短暂一致性达到削峰的目的。
差异部分:老版本库存预占设计仅依靠数据进行数据处理,新版设计依靠切量配置建数据切换到 Redis,利用 Redis 高读写进行削峰操作。

详细设计
主流程:

库存初始化:竞态条件利用 Redis watch 命令来实现锁等待,解决并发场景数据不一致问题。
LUA 执行器:将原子操作指令 / 复用指令封装到 LUA 脚本中以减少网络开销。
补偿机制:i> 执行流程中所有业务异常发生时会同步发起反向操作请求;ii> 反向操作执行异常后会提交异步反向操作任务;iii> 异步任务执行异常后,依赖监 q 控系统扫描异常单据或异常库存并修改异常库存量

回溯回写:任务落库后发出 mq 组装参数调用数据回写服务,数据回写服务操作库存数量;同时回写 redis 数据,释放预占量库存数据;更新任务库数据状态

数据结构
库存记录索引:{deptNo|goodsNo|warehouseNo}|stockStatus|stockType|goodsLevel
hashTag:{deptNo|goodsNo|warehouseNo}|stockStatus|stockType|goodsLevel
可售库存数量:usableKey:{库存记录索引}
扣减库存量:usableSubtractKey:{库存记录索引} ,记录 Redis 到 DB 执行期间减库存量
预占防重 key:operateKey:{库存记录索引:单号} 防重 key 防并发重复请求
回滚防重:rollbackOperateKey:{库存记录索引}
缺量预占库存量:ullageOperateKey:{库存记录索引}
扣减库存单据记录:hSetrecord: {库存记录索引}
key 预占 缺量预占 回滚 回写
可售库存数量 - - + 不变
扣减库存量 + + - -
预占防重 key + + - 不变
回滚防重 不变 不变 + 不变
缺量预占库存量 不变 + 反向 不变
扣减库存单据记录 + + - -
Redis&DB
首先进行 redis & 从库数据比对,若存在差异则对主库进行校验
比对过程中,DB 中 sku 明细行进行锁定 (for update),比对逻辑为 DB 可用库存量 ==(Redis 可用库存量 + Redis 预占量)
有差异,报警且触发 SDK 可用量过期,同时矫正预占量

容灾方案

// 对系统容错 / 降级、监控机制 (空间换稳定性,两份 redis,故障 3 次丢数),流量分布材料,618 流量大、峰值数据切量。数据不一致,多个商家,不能超过 5 分。

预占任务持久化:mysql 需要将核心属性字段数据持久化:事业部,商品编码,仓编码,等级,库存类型,库存状态,预占库存量,任务状态;调度执行完成后需要更新 stockTask 状态为完成

初始化:

(1) lock db

(2) sum stockTask

(3) 使用 DB 可用库存初始化 Redis 可用库存,stockTask 预占量初始化 Redis 预占量

(4) Redis 库存回滚,如果预占量 key 不存在,该 key 不需要回滚

性能结果

23 年 618 大促

切量细则
切量细则

冷热数据
OMS 库存冷热装置

预占架构升级切量重点 key 监控

库存预占架构升级切量商家

架构升级切量商家明细 2

已切量商家

反向切量
原有设计中存在以下名单

禁止切量商家:优先级较高,一旦在名单中,禁止切量

批次库存商家:批次库存管理商家,目前该部分能力尚未建设

动态质押商家:物流金融业务,目前该部分能力尚未建设 切量名单商家:该部分为切量商家

原有切量流程:!禁止切量 ->!批次库存 ->!动态质押 -> 切量名单中,通过以上校验为切量商家。

原有流程在增量商家中需要手动将商家配置到切量名单中才可进行切量操作,对于新增商家场景操作不变,且原有流程中逻辑库存名单为痛点:逻辑库存的启用配置在事业部主数据中,不在库存侧。

新版切量流程中对切量名单进行优化,将原来切量名单商家拆分成非逻辑库存名单、逻辑库存两个名单,其中:

非逻辑库存名单:包含可切量商家

逻辑库存名单:逻辑库存商家,该部分不可切量

原流程新流程对切量商家名单进行优化,拆分成非逻辑库存名单、逻辑库存两个名单

构建模型 (批次库存 & 内存模型待续)

Redis 存储数据结构
MD 生成规则工具集
◦逻辑库存 MD5 工具

 StringBuffer md5Key = new StringBuffer();
 md5Key.append(logicWarehouseStock.getGoodsNo()+"_"+logicWarehouseStock.getWarehouseNo()+"_"+logicWarehouseStock.getOwnerNo()+
         "_"+logicWarehouseStock.getDeptNo()+"_"+logicWarehouseStock.getStockType()+"_"+logicWarehouseStock.getGoodsLevel());
 if(StringUtils.isBlank(logicWarehouseStock.getFactor1())){
     md5Key.append("_0");
 }else {
     md5Key.append("_"+logicWarehouseStock.getFactor1());
 }
 if(StringUtils.isBlank(logicWarehouseStock.getFactor2())){
     md5Key.append("_0");
 }else {
     md5Key.append("_"+logicWarehouseStock.getFactor2());
 }
 if(StringUtils.isBlank(logicWarehouseStock.getFactor3())){
     md5Key.append("_0");
 }else {
     md5Key.append("_"+logicWarehouseStock.getFactor3());
 }
 if(StringUtils.isBlank(logicWarehouseStock.getFactor4())){
     md5Key.append("_0");
 }else {
     md5Key.append("_"+logicWarehouseStock.getFactor4());
 }
 if(logicWarehouseStock.getYn()== null){
  md5Key.append("_1");
 }else {
     md5Key.append("_"+logicWarehouseStock.getYn());
 }
 md5Key.toString().hashCode()

批次库存 MD5 工具
public void fillMd5Value(){
StringBuffer md5Key = new StringBuffer();
md5Key.append(warehouseNo);
md5Key.append("");
md5Key.append(goodsNo);
md5Key.append("
");
md5Key.append(goodsLevel);
md5Key.append("_");
md5Key.append(stockType);
//遍历类字段不遍历map是为了控制MD5的组成顺序
Class clazz = BatchAttrStock.class;
Field[] fields = clazz.getDeclaredFields();
try {
int batchFieldCount = 0 ;
for (Field field : fields){
BatchAttrEnum attrEnum = BatchAttrEnum.batchFieldEnumMap.get(field.getName());
//不是批属性的字段不进入MD5的组成
if (attrEnum == null){
continue;
}
batchFieldCount ++;
field.setAccessible(true);
Object value = field.get(this);
if (value == null ){
md5Key.append("0");
continue;
}
if(field.getType().toString().contains("String")){
md5Key.append(value);
continue;
}
if(field.getType().toString().contains("Date")){
Date timeField = (Date) value;
md5Key.append(timeField.getTime());
continue;
}
throw new RuntimeException(attrEnum.getField()+"填充MD5异常");
}
//默认50个批属性长度,长度不够0补齐
int remainLength = 50 - batchFieldCount;
String str = String.format("%0"+remainLength+"d", 0);
md5Key.append(str);

    }catch (Exception e){
        throw new RuntimeException("填充MD5异常.");
    }

    md5Key.append(yn);
    String md5Value =  MD5Util.md5(md5Key.toString());
    setMd5Value(md5Value);
}

MD&ID & 属性保存工具
本文篇幅有限,余下二期进行分享。

相关文章
|
5月前
|
存储 调度 C++
16 倍性能提升,成本降低 98%! 解读 SLS 向量索引架构升级改造
大规模数据如何进行语义检索? 当前 SLS 已经支持一站式的语义检索功能,能够用于 RAG、Memory、语义聚类、多模态数据等各种场景的应用。本文分享了 SLS 在语义检索功能上,对模型推理和部署、构建流水线等流程的优化,最终带给用户更高性能和更低成本的针对大规模数据的语义索引功能。
485 51
|
6月前
|
网络协议 NoSQL API
转转客服IM系统的WebSocket集群架构设计和部署方案
客服IM系统是转转自研的在线客服系统,是用户和转转客服沟通的重要工具,主要包括机器人客服、人工客服、会话分配、技能组管理等功能。在这套系统中,我们使用了很多开源框架和中间件,今天讲一下客服IM系统中WebSocket集群的的实践和应用。
537 141
|
5月前
|
存储 SQL 消息中间件
从 ClickHouse 到 StarRocks 存算分离: 携程 UBT 架构升级实践
查询性能实现从秒级到毫秒级的跨越式提升
|
7月前
|
存储 供应链 前端开发
如何开发仓库管理系统中的库存管理板块 ?(附架构图+流程图+代码参考)
本文介绍仓库管理系统(WMS)中库存管理模块的开发,涵盖系统简介、库存管理功能设计、业务流程分析、开发技巧与代码示例,以及实现效果和常见问题解答,帮助企业实现高效、精准的库存管理。
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
34_GPT系列:从1到5的架构升级_深度解析
大型语言模型(LLM)的发展历程中,OpenAI的GPT系列无疑扮演着至关重要的角色。自2018年GPT-1问世以来,每一代GPT模型都在架构设计、预训练策略和性能表现上实现了质的飞跃。本专题将深入剖析GPT系列从1.17亿参数到能够处理百万级token上下文的技术演进,特别关注2025年8月8日发布的GPT-5如何引领大模型技术迈向通用人工智能(AGI)的重要一步。
|
6月前
|
供应链 监控 JavaScript
如何开发ERP(离散制造-MTO)系统中的库存管理板块(附架构图+流程图+代码参考)
本文详解MTO模式下ERP库存管理的关键作用,涵盖核心模块、业务流程、开发技巧与代码示例,助力制造企业提升库存周转率、降低缺货风险,实现高效精准的库存管控。
|
6月前
|
消息中间件 监控 Cloud Native
高效设计:支持亿级用户社交关系的100W QPS架构方案
面对亿级用户与百万QPS的高并发场景,性能测试成为系统稳定的关键。本文剖析真实业务痛点,详解从接口压测、全链路监控到瓶颈定位的完整性能体系,助你掌握大厂级性能优化能力,从容应对卡顿、宕机等线上挑战。
|
6月前
|
存储 监控 NoSQL
Redis高可用架构全解析:从主从复制到集群方案
Redis高可用确保服务持续稳定,避免单点故障导致数据丢失或业务中断。通过主从复制实现数据冗余,哨兵模式支持自动故障转移,Cluster集群则提供分布式数据分片与水平扩展,三者层层递进,保障读写分离、容灾切换与大规模数据存储,构建高性能、高可靠的Redis架构体系。
|
6月前
|
存储 JSON 数据处理
ClkLog埋点与用户行为分析系统:架构升级与性能全面提升
随着越来越多企业在实际业务中使用 ClkLog,数据规模和分析需求也不断提升,部分用户日活已经超过10万,为了顺应这一趋势,ClkLog 秉持 “开放透明、持续演进”的理念,推出了迄今为止最重要的一次性能优化升级。新版本在大规模数据处理与复杂查询场景中,性能表现实现了跨越式提升。经过多轮研发与严格测试,新版本现已正式上线:在原有付费版 1.0 的基础上架构全面升级,并同步发布全新的 2.0 版本。为用户带来更强的性能与更广的适用场景。

热门文章

最新文章