如何设计一个高可用的运营系统

简介: 概述一个产品业务的发展总是离不开运营二字。随着业务快速的发展以及新业务的扩充,运营需求越来越大,并且很多时候需要追热点,因此在有限的资源下,如何做到快速、准确、灵活、稳定的满足日趋增多的运营需求,成了个问题。

概述

一个产品业务的发展总是离不开运营二字。随着业务快速的发展以及新业务的扩充,运营需求越来越大,并且很多时候需要追热点,因此在有限的资源下,如何做到快速、准确、灵活、稳定的满足日趋增多的运营需求,成了个问题。我们根据运营的四个基本要数(目标、人群、门槛、激励)通过对活动的抽象、建模、组件化,实现了能满足80%的运营需求的自动化运营系统,运营产品同学只需要通过一份配置文件就可以生成一个新的活动。

引子

 

通常,我们做一个活动,我们需要做什么?

我们需要UI设计、前端排版、接口定义、数据库创建、测试流程等等。这样下来整个流程快一点上一个活动大概一周左右,慢一点可能两周左右。

但很多时候,一个活动的生命周期可能就一周、一个月左右。我们是否有必要花如此大的开发代价去做这样事情?一个活动如此,那十个,一百个呢。

我们先来通过三个活动来了解一下活动的本质。

活动1,为了拉新,针对老用户,每拉来一个人,奖励20元的额度提升。

活动2,为了拉GMV,针对老用户,每还款xx元,奖励多少优惠券。

活动3,为了拉绑卡,针对全部用户,完成绑卡,就有机会抢100张1000元现金券。

...

我们可以发现活动的四个要素:人群、目标、门槛、激励

我们可以用一句话概括运营活动:

针对什么人群,我们想要达到什么目标,设置什么样的门槛(规则),最后给用户什么样的激励措施。

活动生命周期这么短,我们是否可以以比较小的开发代价来完成活动的开发呢? 是否针对某个业务的一个活动开发完?我可以快速的复用到其他业务上呢?

在这些活动的开发中,我们遇到了挑战和难题:

可维护性差:活动的生命周期短,活动下线,接口、数据库废弃,但代码遗留,代码维护性差。

开发效率低:重复开发、开发效率低、无法复用。每个活动新建接口、新建数据库表

可扩展性不高:每个活动只能运用到自己的业务上,无法快速复用到其他业务。

性能和监控: 无可靠的数据监控、性能低下。

安全低:没有做接口签名、接口限流等等,容易被刷。

运营要做什么?

于是我花了一段时间来系统性的来梳理运营体系相关东西,通过已经做了什么,来思考,我们将来怎么做?

接入业务:有了具体的产品,我们才有运营他的基础。

运营活动:有了具体的业务,通过运营活动来运营业务。

用户触达:活动出来后,我们需要告知用户才行。

数据分析:活动效果如何,我们需要分析数据,改进我们的方案。

监控告警:系统本身不是100%可靠,我们需要一些仪表盘来监控我们的系统。

安全/防刷:运营是有激励措施的,有利益,需要防止恶意侵入。

基础能力:通过抽象化、工具化提高开发效率。

组件化系统:是否有个可视化的界面,以便于运营人员的快速接入呢。

根据已做的活动经验和遇到的问题,让我不断的思考,我该如何去优化该运营系统,来提高开发效率、安全、和性能。最后,确定的一个大方向:

平台化、标准化、配置化、组件化。

系统架构设计

 

 

从上往下看:

前端层:做前后分离,动静分离、接入按钮触发统计系统、组件化模块。

网关层:接入协议适配、签名校验,接口监控统计、限流等等。保障接口安全。

逻辑层:分三个子层。

第一层:接入统一配置中心,接口标准统一化、插件化、组件化常用模块。消息处理引入观察者,抽象公用模块。

第二层:根据运营四要素,抽象出规则集(绑卡?还款等等)、奖励集(优惠券、实物?等等)构成活动主逻辑。

第三层:抽象所有活动储存结构(标签服务)、配置、监控、分布式锁计数器以服务形式提供给上层调用。

基础平台:一些依赖的基础能力:比如用户信息、订单信息、平台优惠券系统、基础推送能力等等。

存储层:所有活动数据以统一结构存储。

从左往右看:

一个活动可以快速复用到其他业务。

将活动通过广告系统、消息推送系统等推送出去。通过数据分析系统做数据分析和优化活动流程。

说明几个点:

1.活动路由

所有接口统一通过SaleService.handler接入

根据活动ID与方法找到对应执行方法。

参考MVC的路由方式

通过反射+代理模式实现

这样做的一些好处:

由于活动的什么周期短,可以通过对配置的更改,调整接口的有无。维护方便。

可以很方便的做一些公共校验或埋一些钩子,(比如是否限制登录、是否过期等)

可以与配置系统深度整合。

做一些接口监控和拦截。

2. mq消息(消息的解耦)

观察者模式

对修改关闭,对扩展开放

3.统一配置中心

可以参考之前写的统一配置中心

这里可以优化的点是,引入版本号,先更新配置+新的版本号到redis,然后再更新每个配置的版本号id, 客户端来取配置的时候,先取配置的版本,在根据版本号+配置key去redis中取配置内容,这样可以平滑的将缓存配置切换到新的缓存配置。

4.关于组件化

一个活动通常可以看成若干个组件组成。

每一个组件又有他自己的特性。

前后端如何通过组件交互?

最好能在OA编辑就完美了

最后,通过一些配置,可以快速的上线一些活动,无需开发接入,做到自动化运营。

一些个人观点

程序的开发,应该是一个搭积木的过程,一些小的模块组合成一个中等模块,若干中等模块组合成一个系统,若干系统组合成一个业务等等。

一个大的问题,可以分层分模块成若干小问题,解决若干小问题,最后解决大问题。

了解业务,才能做出更好的系统设计。

系统设计,要充分考虑到性能、可用性、可扩展性、可伸缩性、安全性等。

欢迎工作一到五年的Java工程师朋友们加入Java架构开发:744677563

本群提供免费的学习指导 架构资料 以及免费的解答

不懂得问题都可以在本群提出来 之后还会有职业生涯规划以及面试指导

相关文章
|
1月前
|
容灾 网络协议 数据库
云卓越架构:云上网络稳定性建设和应用稳定性治理最佳实践
本文介绍了云上网络稳定性体系建设的关键内容,包括面向失败的架构设计、可观测性与应急恢复、客户案例及阿里巴巴的核心电商架构演进。首先强调了网络稳定性的挑战及其应对策略,如责任共担模型和冗余设计。接着详细探讨了多可用区部署、弹性架构规划及跨地域容灾设计的最佳实践,特别是阿里云的产品和技术如何助力实现高可用性和快速故障恢复。最后通过具体案例展示了秒级故障转移的效果,以及同城多活架构下的实际应用。这些措施共同确保了业务在面对网络故障时的持续稳定运行。
|
6月前
|
物联网 区块链
应用多活技术问题之企业利用应用多活技术进行稳定性能力扩展如何解决
应用多活技术问题之企业利用应用多活技术进行稳定性能力扩展如何解决
|
8月前
|
运维 监控 容灾
构建高可用性运维体系的关键要素
在现代企业中,IT基础设施的稳定性和可用性直接影响业务的连续性和用户体验。本篇文章将深入探讨如何通过精细化的运维管理,建立一个高可用性的运维体系。从自动化运维、监控系统、故障排除到灾备方案,这些关键要素将为企业打造坚实的技术保障。
|
9月前
|
设计模式 架构师 安全
如何提高自己的架构设计能力?
提升架构设计能力涉及深入学习基础知识、业务理解、技术广度与深度、实践经验等多方面。要关注代码的清晰结构、抽象能力、系统性能和可扩展性。学习编程语言、设计模式、系统设计原则和分布式系统是关键。通过实际项目和不断学习反思,可以增强架构设计技能。例如,上述代码展示了清晰的结构和设计原则应用。
493 0
|
缓存 数据库 API
如何设计高可用系统之故障隔离
简单来说,当功能或性能不符合预期,就是故障。减少故障的方式有多种,包括系统优化、监控、风险扫描、链路分析、变更管控、故障注入演练、故障隔离等。故障隔离是其中一种手段,并且要求在系统设计时就需要考虑清楚。
2504 0
|
存储 运维 分布式计算
系统设计:如何让系统高可用?
系统设计:如何让系统高可用?
593 3
系统设计:如何让系统高可用?
|
消息中间件 缓存 容灾
|
消息中间件 运维 监控
业务开发转基础开发,这三种「高可用」架构你会么?
业务开发转基础开发,这三种「高可用」架构你会么?
|
运维 监控 关系型数据库
云方案丨数据库高可用、高并发运维解决方案在医疗行业的运用
前言 “全面上云的拐点到了!”7月25日,阿里云智能总裁张建锋在2019阿里云上海峰会上做出了明确回答。张建锋表示,今年是云产业一个非常重要的拐点。云上服务与数据库服务成为各类云服务厂商争夺的市场,数据库“高可用“俨然已成为云原生数据库产品的标配,但还未上云的存量数据库该何去何从? 方案背景互联网兴起,银行、医疗、政府行业也步入了智能时代。
1738 0
|
监控 安全 Java
如何设计一个高可用的运营系统
概述 一个产品业务的发展总是离不开运营二字。随着业务快速的发展以及新业务的扩充,运营需求越来越大,并且很多时候需要追热点,因此在有限的资源下,如何做到快速、准确、灵活、稳定的满足日趋增多的运营需求,成了个问题。
1318 0

热门文章

最新文章