架构设计第五讲:数据巡检系统的设计与应用

简介: 架构设计第五讲:数据巡检系统的设计与应用

1、数据巡检系统

1.1、背景知识

1、为什么做数据巡检系统?
  • 为了保障系统上下游数据一致性
2、哪些因素会产生一致性问题?
  • 人为因素:场景遗漏,上游业务变更忘记联动下游业务
  • 系统异常:服务器 FullGC,CPU 100%,服务器扩容、缩容、重启等异常场景
3、订单、财务,哪些数据做了同步?
  • 涉及的表
  • 关键字段(需保障一致性)
  • 与搜索相关的字段
  • 业务计算相关字段
  • 非关键字段(不用保障数据准确性)
4、触发同步的时机有哪些?

货代

  • 场景1:创建订单 admin/v1/agent/order/create
  • 场景2:复制订单 /admin/v1/agent/order/copy/create
  • 场景3:更新订单 admin/v1/agent/order/update
  • 场景4:修改订单状态 v1/agent/order/changeState
  • 场景5:更新应收应付费用状态 /admin/v1/agent/order/changeFeeState

车队

  • 场景1:创建主订单 admin/v1/convoy/order/create
  • 场景2:更新主订单 /admin/v1/convoy/order/update
  • 场景3:批量更新子订单状态 admin/v1/convoy/order/state/batchUpdate
  • 场景4:编辑子订单 /admin/v1/convoy/order/sub/update
  • 场景5:添加子订单 admin/v1/convoy/order/sub/add
  • 场景6:子订单列表页点击修改后保存的数据 admin/v1/convoy/order/partUpdate

1.2、方案

1、现有业务梳理
  • 货代订单联动财务
  • 车队订单联动财务

2、存在的问题
  • 1、耦合性强。
  • 采用定时任务补偿的方式解决一致性问题。补偿逻辑嵌套在业务系统中,高耦合。
  • 2、不够抽象。
  • 对账逻辑散落在各个业务系统,相同功能代码,多次编写。将各个系统的数据获取逻辑、对账逻辑差错处理逻辑可以做收拢处理;
  • 使用策略模式
3、通用对账逻辑
  • 通用逻辑

方案如上图所示:

  • 开一个新项目,专门用于处理对账逻辑。
  • 业务注册:将需要处理的对账业务设计成策略,然后注册到Spring中
  • 数据获取:定时任务按更新时间查询近5s到近65s的数据(近5s是防止mq还没来得及消费),先获取上游业务,拿到ids,然后由ids查询下游业务
  • 对账处理:由于必须先获取上游业务,如果上游业务数据为空,暂不考虑这种场景;–》如果下游业务不存在,说明需要做新增操作 --》如果数据不一致(按订单更新时间),说明需要联动
  • 哪些数据需要做比对?怎么比对?
  • 场景1: 上游业务存在,下游不存在 create
  • 场景2:上游业务删除了数据,下游没有联动 delete
  • **业务允许硬删除吗?**订单业务在页面上不会硬删除
  • 什么场景下订单数据会硬删除呢?
  • 业务状态置为作废后,下游业务能查到吗? 目前是可以查到的
  • 该场景暂不考虑
  • 场景3: 上游修改了数据,但下游没联动 update
  • 数据不一致,记录到 falcon_biz_diff表里面,便于统计
  • 差错处理
  • 怎么去做补偿?
  • 方法1:异步推送存在问题的订单数据,让下游自行处理。
  • 优点:异步处理,
  • todo项:限流处理,超过最大重试次数后 log.error、且配置死信告警。
  • 消费失败后,配置监控告警,研发及时介入处理
  • 方法2:调用下游业务提供的rpc接口,做数据同步处理。
  • 缺点:可能存在性能问题
  • 调用rpc失败后,需研发自行设计重试逻辑
  • 达到的效果
  • 1、相同功能代码,不用多次编写;
  • 2、可扩展性强,当需要增加新功能时,非常方便
4、性能问题
  • 1、把mapper拷贝到对账系统中,采用多数据源,在系统里面读数据和写数据,业务方无感知
  • 好处是:这样可以减少对业务系统的压力
  • 风险是:业务变了,有些字段需要同步,有些不需要同步,我这边也得随时调整
  • 二期可以这样做
  • 2、待优化点
  • 1、上游业务的更新时间、下游业务的更新时间如果数据不一致,保存起来,最好放在json里面
  • 2、任务执行周期:推荐半小时或1小时比对一次
  • 3、暂不考虑mq消费堆积或消费延迟问题:如果下游mq消费比对账任务慢,先不考虑

1.3、方案细节

  • 接口设计
  • 1、rpc接口:
  • 货代订单提供rpc接口,由更新时间(起始,终止)批量查询订单详情
  • 车队子订单提供rpc接口,由更新时间(起始,终止)批量查询子订单详情
  • 货代财务订单提供rpc接口,由订单ids 批量查询财务订单详情
  • 车队财务子订单提供rpc接口,由子订单ids 批量查询财务订单详情
  • 2、对账系统
  • 策略类:
  • 货代订单策略:提供 数据获取接口 对账处理接口,差错处理接口
  • 车队订单策略:提供 数据获取接口 对账处理接口,差错处理接口
  • 定时任务
  • 提供对象功能:拿到全部策略,遍历处理 --》执行相应的策略类提供的方法,将差异数据落库处理
  • 表结构设计
  • 表1:falcon_biz_increment 暂不用考虑
  • 表2:falcon_biz_diff
  • id 主键id long
  • bizId 业务id long
  • bizType 业务类别 String
  • keyFieldJson 业务关键字段数据 String
  • diffType 差异类别 (create、update、delete) integer
  • batch_id bigint '批次id
  • status tinyint(1) DEFAULT ‘0’ COMMENT ‘状态,0-待确认,1-确认’,
  • tenant_id 租户id
  • CreateAt 创建时间
  • UpdateAt 更新时间
  • 数据库设计
  • 新增一个库
CREATE TABLE IF NOT EXISTS `falcon_biz_diff`
(
    `id`          bigint      unsigned auto_increment comment '主键id' primary key,
    `biz_id`       bigint      not null COMMENT '业务id',
    `biz_type`     varchar(20) not null COMMENT '类型',
    `key_field_json` longtext   not null comment '业务关键字段数据',
    `diff_type`    tinyint      null comment '差异类别 (create、update、delete)',
    `batch_id`     bigint      null comment '批次id',
    `status`        tinyint(1) DEFAULT '0' COMMENT '状态,0-待确认,1-确认',
    `tenant_id`    bigint      not null COMMENT '租户id',
    `create_time` datetime default CURRENT_TIMESTAMP not null comment '创建时间',
    `update_time`   datetime default CURRENT_TIMESTAMP not null on update CURRENT_TIMESTAMP comment '更新时间'
) DEFAULT CHARACTER SET = utf8mb4 COMMENT = '数据表';

数据库实例

  • rm-wz936ji5413x9l86j 真线
  • rm-wz9d545c689v19pss 测试环境
  • 库名:falcon-coordination 待开通权限
  • 表名:falcon_biz_diff
  • 待确认:使用单独的库还是共用其他库,如果是共用,共用哪个库?

项目

  • falcon-coordinate 对账服务
  • git项目权限 todo 待开通权限

项目结构

  • 直接看代码

1.5、参考资料

  • maven脚手架,快速创建一个新应用

2、上线后的效果

todo

3、数据巡检系统二期规划

巡检服务:

  • 检测慢sql mysql.存起来,然后推送给钉钉
  • 检测daily环境和线上环境表结果的不一致,记录起来
  • 检测redis慢查询,大key,记录起来

Action1:对账系统存在的问题

  • 问题1:数据读取逻辑,是通过rpc还是通过直连db,多数据源
  • 最终方案:
  • 使用rpc来拉取数据订单和财务数据
  • 原因:
  • 货代订单:order_info 单表同步到 货代财务:finance_order、finance_fare_info两张表
  • 车队订单:order_info、sub_order_info、sub_order_doors_info、sub_order_carrier_info 四张表同步给 车队财务finance_sub_order_info、finance_fare_info,finance_carrier_info三张表,字段映射极为复杂, 如果选择直连db、通过写sql的方式来执行查询逻辑,太过于复杂
  • 问题2:字段比对逻辑
  • 方案:
  • 需要统计出具体哪几个字段发生了变化并落库,因此使用注解 + 反射来做比对逻辑
  • 需要对比的字段范围
  • 对关键数据,才进行diff操作,减少工作量
  • 关键数据指:财务服务 在列表页作为搜索条件的数据、以及参与业务计算的数据,非关键数据可以rpc反查订单得到
  • 问题3:定时任务执行周期
  • 执行周期暂定5分钟
  • 问题4:车队财务反查逻辑漏洞
  • 存在的问题:
  • 财务按更新时间调用rpc反查订单时,车队订单只是将更新时间范围内的子订单返回给财务
  • 需要改造为:
  • 将order_info、sub_order_info、sub_order_doors_info、sub_order_carrier_info这四张表在更新时间范围内的数据(交集)返回给财务

Action2:进公司做什么价值大?

  • 服务A、B、C间的联动,各业务的边界,服务间的交互
相关文章
|
28天前
|
运维 Cloud Native 持续交付
深入理解云原生架构及其在现代企业中的应用
随着数字化转型的浪潮席卷全球,企业正面临着前所未有的挑战与机遇。云计算技术的迅猛发展,特别是云原生架构的兴起,正在重塑企业的IT基础设施和软件开发模式。本文将深入探讨云原生的核心概念、关键技术以及如何在企业中实施云原生策略,以实现更高效的资源利用和更快的市场响应速度。通过分析云原生架构的优势和面临的挑战,我们将揭示它如何助力企业在激烈的市场竞争中保持领先地位。
|
30天前
|
人工智能 前端开发 编译器
【AI系统】LLVM 架构设计和原理
本文介绍了LLVM的诞生背景及其与GCC的区别,重点阐述了LLVM的架构特点,包括其组件独立性、中间表示(IR)的优势及整体架构。通过Clang+LLVM的实际编译案例,展示了从C代码到可执行文件的全过程,突显了LLVM在编译器领域的创新与优势。
49 3
|
20天前
|
监控 安全 API
使用PaliGemma2构建多模态目标检测系统:从架构设计到性能优化的技术实践指南
本文详细介绍了PaliGemma2模型的微调流程及其在目标检测任务中的应用。PaliGemma2通过整合SigLIP-So400m视觉编码器与Gemma 2系列语言模型,实现了多模态数据的高效处理。文章涵盖了开发环境构建、数据集预处理、模型初始化与配置、数据加载系统实现、模型微调、推理与评估系统以及性能分析与优化策略等内容。特别强调了计算资源优化、训练过程监控和自动化优化流程的重要性,为机器学习工程师和研究人员提供了系统化的技术方案。
140 77
使用PaliGemma2构建多模态目标检测系统:从架构设计到性能优化的技术实践指南
|
13天前
|
机器学习/深度学习 算法 数据可视化
基于深度混合架构的智能量化交易系统研究: 融合SSDA与LSTM自编码器的特征提取与决策优化方法
本文探讨了在量化交易中结合时序特征和静态特征的混合建模方法。通过整合堆叠稀疏降噪自编码器(SSDA)和基于LSTM的自编码器(LSTM-AE),构建了一个能够全面捕捉市场动态特性的交易系统。SSDA通过降噪技术提取股票数据的鲁棒表示,LSTM-AE则专注于捕捉市场的时序依赖关系。系统采用A2C算法进行强化学习,通过多维度的奖励计算机制,实现了在可接受的风险水平下最大化收益的目标。实验结果显示,该系统在不同波动特征的股票上表现出差异化的适应能力,特别是在存在明确市场趋势的情况下,决策准确性较高。
49 5
基于深度混合架构的智能量化交易系统研究: 融合SSDA与LSTM自编码器的特征提取与决策优化方法
|
24天前
|
机器学习/深度学习 人工智能 并行计算
【AI系统】Kernel 层架构
推理引擎的Kernel层负责执行底层数学运算,如矩阵乘法、卷积等,直接影响推理速度与效率。它与Runtime层紧密配合,通过算法优化、内存布局调整、汇编优化及调度优化等手段,实现高性能计算。Kernel层针对不同硬件(如CPU、GPU)进行特定优化,支持NEON、AVX、CUDA等技术,确保在多种平台上高效运行。
78 32
|
24天前
|
存储 机器学习/深度学习 人工智能
【AI系统】计算图优化架构
本文介绍了推理引擎转换中的图优化模块,涵盖算子融合、布局转换、算子替换及内存优化等技术,旨在提升模型推理效率。计算图优化技术通过减少计算冗余、提高计算效率和减少内存占用,显著改善模型在资源受限设备上的运行表现。文中详细探讨了离线优化模块面临的挑战及解决方案,包括结构冗余、精度冗余、算法冗余和读写冗余的处理方法。此外,文章还介绍了ONNX Runtime的图优化机制及其在实际应用中的实现,展示了如何通过图优化提高模型推理性能的具体示例。
53 4
【AI系统】计算图优化架构
|
5天前
|
容灾 网络协议 数据库
云卓越架构:云上网络稳定性建设和应用稳定性治理最佳实践
本文介绍了云上网络稳定性体系建设的关键内容,包括面向失败的架构设计、可观测性与应急恢复、客户案例及阿里巴巴的核心电商架构演进。首先强调了网络稳定性的挑战及其应对策略,如责任共担模型和冗余设计。接着详细探讨了多可用区部署、弹性架构规划及跨地域容灾设计的最佳实践,特别是阿里云的产品和技术如何助力实现高可用性和快速故障恢复。最后通过具体案例展示了秒级故障转移的效果,以及同城多活架构下的实际应用。这些措施共同确保了业务在面对网络故障时的持续稳定运行。
|
9天前
|
机器学习/深度学习 存储 人工智能
基于AI的实时监控系统:技术架构与挑战分析
AI视频监控系统利用计算机视觉和深度学习技术,实现实时分析与智能识别,显著提升高风险场所如监狱的安全性。系统架构包括数据采集、预处理、行为分析、实时决策及数据存储层,涵盖高分辨率视频传输、图像增强、目标检测、异常行为识别等关键技术。面对算法优化、实时性和系统集成等挑战,通过数据增强、边缘计算和模块化设计等方法解决。未来,AI技术的进步将进一步提高监控系统的智能化水平和应对复杂安全挑战的能力。
|
14天前
|
机器学习/深度学习 前端开发 算法
婚恋交友系统平台 相亲交友平台系统 婚恋交友系统APP 婚恋系统源码 婚恋交友平台开发流程 婚恋交友系统架构设计 婚恋交友系统前端/后端开发 婚恋交友系统匹配推荐算法优化
婚恋交友系统平台通过线上互动帮助单身男女找到合适伴侣,提供用户注册、个人资料填写、匹配推荐、实时聊天、社区互动等功能。开发流程包括需求分析、技术选型、系统架构设计、功能实现、测试优化和上线运维。匹配推荐算法优化是核心,通过用户行为数据分析和机器学习提高匹配准确性。
47 3
|
12天前
|
前端开发 搜索推荐 安全
陪玩系统架构设计陪玩系统前后端开发,陪玩前端设计是如何让人眼前一亮的?
陪玩系统的架构设计、前后端开发及前端设计是构建吸引用户、功能完善的平台关键。架构需考虑用户需求、技术选型、安全性等,确保稳定性和扩展性。前端可选用React、Vue或Uniapp,后端用Spring Boot或Django,数据库结合MySQL和MongoDB。功能涵盖用户管理、陪玩者管理、订单处理、智能匹配与通讯。安全性方面采用SSL加密和定期漏洞扫描。前端设计注重美观、易用及个性化推荐,提升用户体验和平台粘性。
40 0

热门文章

最新文章