本文来源:支付宝体验科技
本文是支付宝账户支付业务技术团队在《大象转身-支付宝资金技术交付提效之路》系列总结之一。本文作者:朱董勇(道风),代巍(呆莫)。
前言
如果你正在负责一个存在多个阵地或产品页面的搭建及后续大量的精细化运营及投放诉求的业务,你正在遭受如下的困扰:
1)每个运营类需求,都需要投入研发资源,同质化烟囱式开发严重,研发同学幸福感低
2)运营配置无法实现业务自助化,技术同学代运营,占用技术同学大量时间
3)运营需求技术方案涉及多个平台的配置,跨平台配置风险高体验差,业务自运营吐槽严重
那么这篇文章也许对您有收获,通过这篇文章您将会全面了解本文要讲的主角《满天星平台》:
1)满天星的核心产品能力是什么,能够帮助业务解决什么问题?
2)如何基于满天星平台提供的搭建及精细化运营投放能力,提升业务的研发效率和运营效率。
发展中遇到的问题
一句话描述发展中遇到的问题:随着场景创新增多,各种产品和阵地的建设诉求爆发,传统的烟囱式开发模式面临研发效率和运营效率低下的问题,创新的成本居高不下。
1. 简单说说背景
在最近的三年时间,我们尝试了很多业务创新,小荷包、商家转账等现在的产品就是这一段时间的产物。创新不易,每次创新成功的背后都伴随着无数的失败 (这三年中,资金技术支撑了十几个创新产品的建设,包含小程序、H5、各类行业解决方案等等)。众所周知创新是九死一生,技术要做的就是帮助业务降低机会成本。
各类产品阵地建设的井喷现状带让团队意识到,每个创新产品都离不开下面这两个发展阶段:产品初期的快速搭建,产品养成期的精细化运营。
孵化产品就像培养一个孩子,不是说将孩子生出来就完事了,还面临着后面的各种培养过程,最终才有可能成长为参天大树。要支持各种创新idea的快速验证,上述的两个阶段的都需要快,帮助业务降低成本快速试错。
2021年,支付宝资金技术成立了“资金场景创新提效项目”,旨在通过一站式搭建和增长平台来促进场景创新的效率,更好地服务于支付宝资金创新业务。团队决定将这个围绕搭建和增长的平台命名为:满天星,寓意奉献。希望创新产品能够像满天星辰,遍地开花。
2. 问题定义:创新现状效能瓶颈
要解决具体的问题,必然离不开对当时现状的分析,通过对过往承接的需求进行分析,发现如下几个突出的问题:
- 研发效率低:运营类研发需求占比较高,交付周期长,人员投入成本居高不下
- 运营效率低:技术化配置堆叠,运营同学参与门槛高,无法自助化,运营对技术吐槽严重
- 效果反馈慢:运营数据效果分析,各个业务独立投入数据研发资源,数据标准杂乱无序
在这样的背景下,团队很难释放研发资源投入到更多创新的尝试中去。研发效率和运营效率问题的解决在当时已刻不容缓。
3. 问题分析:共性需求应可复制
要解决产品创新所面临的通用问题,就需要对现状的诉求做共性的归纳,在做归纳的过程中发现所有产品阵地的运营类的需求都是类似的,它是产品搭建和运营投放的一个结合体,类比于培养一个小孩,搭建是一个生的过程,后期运营是一个养的过程。鉴于不同的孩子,生下来的天赋是不一样的,有些人是有很强的艺术细胞,有些是有个很强的运动细胞。那么试想一下如果所有的孩子,在出生的那一刻就具备了所有的天赋,比如同时具有艺术细胞和运动细胞,而且后续培养的体系也是同样的,那么最终会不会批量产生同样的天才?对于产品创新,大家希望通过体系化平台化标准化的方式批量培养多个产品,形成一个产品工厂,降低产品创新的门槛。
4. 解题思路:搭投一体、多端输出、一站运营
如上所述,一个孩子的培养离不开生和养的过程,对应一个产品生对应搭建,养对应运营。评价一个孩子培养的好不好对应数据的分析反馈。那么要做这样的一个通用平台就离不开构建&运营&反馈这三个环节,正是基于这样的一个前提,决定设计一站式精细化运营平台。
- 构建面-快速搭建:一个产品的页面是有无数个模块排序组合而成,初始的版本构建就离不开页面及模块这两个要素,无非是针对不同的人群业务规则疲劳度等等进行策略规则的控制,针对不同的群体进行千人千面的呈现。例如:支付宝的通用版和老年版,产品能力方面并无不同,只是针对老年版屏蔽了很多营销相关的模块。再延伸来讲,比如还要出一个年轻版理论上也可以做到不需要研发的,通过配置不同的策略控制页面及模块的展示呈现即可。
- 运营面-精细化运营:运营面的建设更多是偏向于一个投放的逻辑,无非是在什么时间什么地点针对什么样的人群基于什么样的规则呈现什么样的内容,是不是需要对疲劳度进行控制,需不需要针对内容做不同的实验,需不需要算法干预内容排序等等。再比如:针对于中国人需要投放的是中文展示的内容,针对于外国人需要呈现的是基于不同语言的展示。语言国际化本质上也是一种内容,也可以被各种策略规则所控制。
- 数据面-数据智能:页面整体的效果怎么样,模块投放内容的转化率如何,这些都是统一数据标准需要解决的问题,完整的全链路数据标准和标准搭投数据效果产品,通过统一的埋点、离在线数据洞察体系,注入运营过程中的运营策略和业务指标,满足运营同学在运营过程中的数据洞察需求,提升业务增长的转化
- 多端输出:页面推荐方案及模块的推荐方案的内容都是由服务端统一决策,并形成标准的协议返回给前端进行呈现,所以天然就不用关注端具体的呈现形式和技术栈。小程序,H5, Native,PC站点类的产品都可以统一接入平台,并使用平台提供的所有精细化运营能力
- 一站式运营:老生常谈的问题,支付宝内部拥有了太多太多提供基础能力的平台,且都有标准的接入方式,这些平台都属于运营的工具,需要将这些工具通过一个平台对接整合在一起为运营提供一站式的配置体验。
关键架构设计
一个好的架构设计必须遵循一定的原则。满天星的初始建设过程当中,团队希望通过灵活的架构的设计达到以下几个标准。
- 易扩展性:搭投一体的运营提效平台应该具备易扩展性。为实现这一目标,需要明确并严格划分领域模型的分层和边界,以确保平台能够承载各种实体,如页面、模块、方案、内容和策略等,并有效地维护它们之间的关系。
- 可复用性:搭投一体的运营提效平台还应具备可复用性,以提高开发效率和降低成本。平台应该设计为可复用的组件和服务的集合,从而能够在不同的业务场景中共享和复用已有的功能和解决方案。通过建立标准化的接口和统一的数据模型,可以实现模块化的拆分和组合,在不同的应用场景中快速搭建和调整投放策略,配置化实现开发免研且减少重复工作。
- 高稳定性:稳定性是搭建、投放一体的运营提效平台的基石之一。高稳定性保证平台能够持久无故障地运行,为用户提供可靠的服务。通过采用高可用的架构、实时监控、故障恢复和备份策略,平台能够解决潜在的故障点和瓶颈,并确保数据的完整性和安全性。高稳定性还包括高性能的处理能力,以应对高并发和大规模数据的处理需求。
- 极致体验:为营造卓越用户体验,搭建、投放一体的平台应追求极致体验。用户界面友好、交互动线顺畅。通过精确的数据分析、智能的推荐和个性化定制,平台能够为用户提供符合其需求和偏好的个性化体验,提高用户的参与度、满意度和忠诚度。
1. 领域模型
领域模型的设计也是围绕着构建和运营展开,展开来讲有如下几个重点要提及的概念
- 页面:一个页面有无数个模块组成
- 模块:可以简单理解为小程序页面上个的各个豆腐块坑位,是所要运营投放的最小单元
- 页面方案:比如支付宝首页通用版的页面方案包含了四大金刚+小程序宫格+各类营销模块,而老年版只包含了四大金刚+小程序宫格,这就是针对页面的两个不同的方案,每个页面方案引用了不同的模块
- 模块方案:和页面方案类型,比如一个营销坑位,针对年轻人人群和老年人人群我希望投放不同的内容进行呈现,那么就是两个不同的模块方案,每个方案投放的内容由运营配置不同而已
- 策略约束:就是上文中提到的在什么时间什么地点针对什么样的人群基于什么样的规则呈现什么样的内容,是不是需要对疲劳度进行控制,需不需要针对内容做不同的实验,需不需要算法干预内容排序等等。策略执行引擎是满天星能够实现千人千面展示的关键所在,策略能力的扩充在框架设计上面是开放的,可以不断叠加新的策略决策能力并沉淀为满天星通用的平台能力,比如针对近场营销要将lbs作为一种新的策略规则类型(通用的规则决策也可以做到这一点,但如果是为了运营同学的配置体验要将其独立出来也是非常容易的),扩展是很方便的。不同的策略呈现不同的页面展示效果,如下图所示:
2. 系统架构
满天星的架构设计具备以下几个要点:
- 去中心化:满天星的推荐核心聚合了满天星的所有策略决策能力,并提供了中心化和近端化的两种集成方案。具体来解释下这里的中心化和近端化是什么意思,举个例子:小荷包作为创新型的产品,早期流量直接打到资金创新应用这个系统,后续将资金创新应用这个系统建设成了满天星中心化的推荐核心,后续很多产品的运营都采用了这种接入方式,都是前端直接调用资金创新应用上面的满天星RPC接口获取千人千面的推荐内容,后端完全0研发量,也没有任何接入成本。随着越来越多的业务接入,资金创新应用现有的机器数无法承接具有非常大流量的业务,例如银行卡,所以满天星平台提供了近端化的SDK让银行卡引用进行集成,服务端简单引用一个SDK即将银行卡应用变成了一个银行卡专属的推荐核心,银行卡的流量完全打到银行卡应用集群。近端化是满天星可以支撑任何域任何业务的一个前提。类比于实验平台的近端SDK可以支持蚂蚁集团的所有业务。近端化同时也可以让所有系统的机器都可以成为一个推荐核心机器资源池,解决中心化可能带来的机器资源瓶颈问题,降低公司机器资源投入成本。
- 零后端研发投入:满天星提供了唯一的接口供业务方使用,前端可直接调用无需后端介入,也支持后端系统直接调用的tr,彻底释放后端的研发资源投入。举几个近几年创新业务的常见案例,比如小荷包产品的开户拉新场景、转账生活费场景、C/B的新余额小程序阵地等,这些偏固定阵地、营销阵地的产品研发,基本分为前端小程序交互页面(前端)+ 内容决策供给服务(服务端),这些内容决策供给服务完全由满天星进行输出,后端同学无需参与其中。
- 运营时运行时分离:满天星的后台配置称为运营时,而运行时是指上文中集成了近端SDK的流量承载系统比如资金创新应用系统,银行卡系统等。运营时和运行时是分离的,运营时的配置是通过配置的整体三板斧发布过程,才在运行端生效,运营端即使挂掉也不会对现有运行时系统产生任何影响。能够很好地进行稳定性问题的隔离。
3. 构建链路
满天星的构建链路比较简单明了,核心主要围绕上文提到的构建&运营&反馈,形成产品增长运营的闭环,动线极简,简单来说就是一设计二配置三调用,具体的构建链路示意参考下图:
4. 技术风险
随着接入满天星的业务越来越多,满天星也经历了巨大的风险与挑战,这也是很多系统在架构演进过程中必然会面临的问题,满天星在这一阶段主要面临了如下的风险与挑战,也采用了相对应的方案去应对。
- 海量流量的挑战:上文中提到的去中心化,近端化接入的方案很好地解决了这个问题,此处不再赘述
- 性能稳定性的挑战:满天星早期为了快速落地支撑创新业务,在配置的存储和发布链路上面是复用了之前基于规则存储的底层架构能力(早期完全复用,研发周期短,落地快,但提前预知到可能会有业务蓬勃接入的状况,早期的接口设计就遵循了APIfirst的原则,能够完全支持后续存储方案的便利切换),随着流量越来越大,接入业务越来越多,基于规则引擎的计算对CPU及JVM的稳定性,以及业务的调用耗时都凸显出了比较大的问题。平台最终采用的自建DB的方式取代了现有的基于规则引擎的存储, 并进行了顺滑的迁移,系统性能得到大幅提升
- 运维成本的挑战:业务接入越来越多,满天星团队资源有限,在用户无法完全自助的情况下,团队的运维成本有很大挑战,所以需要从提升用户自助化率方面下功夫,比如简化运营动线,提供所见即所得能力,多环境自助自检验证等能力的建设。取得了很好的效果,目前满天星团队几乎无人工支持成本投入。
如何为业务提效
通过上文的介绍,大家应该对满天星有了一个初步的了解,构建满天星平台的最原始的初衷是为业务提效,为创新提效。围绕着提效这个命题,本章节想展开讲一讲。提效方面满天星主要围绕了如下提效的三个方面:研发交付提效,运营提效和数智化提效。
1. 研发提效
1.1 提效应对思路
大家首先感受一下传统研发模式,各业务场景与阵地的开发方式实际上还是比较割裂和繁琐的,业务线的前后端团队通常各自理解页面交互,并分别制定契约和进行逻辑开发。然而,这一过程中存在许多问题。一方面,各业务线独立进行开发,导致缺乏横向复用的机会。另一方面,该实现方式主要依赖代码和技术配置来支持运营行为,运营同学难以直接参与运营活动。此外,后续的演进需求还需要等待研发周期,无疑拖慢了场景和阵地迭代升级的节奏。
在满天星搭投一体的构建模式下,生产关系变得更加顺畅。满天星完全解放了后端研发,通过引擎的抽象、宽接口和闪蝶协议通讯适配等通用设计,后端的服务全都由满天星接口来承接,后端同学完全无需参与其中。而前端同学只需关注闪蝶组件的复用和模板设计,并通过满天星的宽接口进行调用。与此同时运营同学可基于前端同学构建的模板进行实例化(场景创建),填充内容并注入相应的精细化运营策略,随后发布和推送相关的元数据。等端上的流量接入后,就可以轻松完成页面、阵地的渲染以及后续的运营。这样就可以做到让一个场、阵地构建和增长更加敏捷。
1.2 实际案例带入
以下和大家再带入一个银行卡首页的案例来看整个生产过程,可能会对满天星的研发提效的有比较直观的感受,首先后端研发资源已经不需要参与到研发过程中,前端同学通过极其简单的3个步骤就可以自行接入:
- 一设计:设计模块的数据结构,这里采用的蚂蚁集团标准的闪蝶协议,很多投放平台都是使用这样的一套协议,分钟级即可设计完成运营所希望配置的业务化配置数据结构
- 二配置:配置一套投放的内容比如图片文案等,并配置好投放策略比如在什么时间什么地点针对什么样的人群基于什么样的规则进行投放
- 三调用:满天星提供了唯一极简的接口,前端或后端可以直接调用即可
2. 运营提效
通过上文的介绍,大家应该对满天星如何给研发带来提效有了比较直观的了解,除了研发提效,运营提效也是满天星核心想要解决的命题之一。一个好的产品,是不需要推广的,提供极致的用户体验,通过用户的口碑传播,就可以有有很好的推广效果。满天星在设计之初就做了这样的考虑,希望提供极简的运营配置投放界面,让运营同学的理解和使用成本变得很低,运营同学直接选择模块进行投放方案的配置即可。
2.1 所见即所得的配置
满天星运营配置后台集成了虚拟机,运营同学每次运营配置的变更都可以在未发布上线之前,以最直观的方式验证上线后在前端的展示效果
2.2 极简化的操作界面
满天星将投放的方案,内容以及投放的策略浓缩在同一个配置页面上面,运营同学的理解和使用成本变得很低。
比如在上面样的时间周期,针对什么样的人群,什么样的业务规则和营销规则下,以什么样的疲劳度控制对用户展示什么样的内容。基于内容也可以一键创建实验等等。
2.3 快捷的业务验证手段
满天星提供了多环境发布自检的能力,预发,灰度,线上流量灰度,线上发布每个环节,都提供了一键自检的能力,在线上全量推送之前为业务提供安全和稳定性的保障。
2.4 完备的灰度推送能力
运营类的配置变更本质上也是一种配置变更,按照蚂蚁集团的配置变更军规,整个配置的变更过程都要符合三板斧的发布上线原则,满天星作为可以赋能所有业务的通用性运营平台,它的灰度能力是必须是完善和健全的,为此满天星平台建设了多阶段发布推送的灰度能力,上线之前会经历白名单验证-集团灰度验证-线上流量灰度验证-全量推送验证等整个验证阶段,业务在每个环节都可以进行实际业务效果的验收,同时每个环节的变更也会同步上报变更管控核心。
3. 数智化提效
3.1 数据效果反馈
运营的最终效果离不开数据层面的呈现,满天星平台提供的统一的离在线数据,提供给运营同学进行实际运营效果的评估。帮助运营同学通过数据反馈调整优化运营策略,助力业务增长。
3.2 智能化算法推荐
在数智化的背景下,满天星针对页面及模块的千人千面的展示引入了算法干预的能力,各个有数智化推荐诉求的团队,只需要投入算法相关的资源即可使用满天星的通用能力进行推荐的智能化干预。
阶段性总结
1. 满天星平台目前取得的成果
满天星在过去3年的发展过程中,赢得了用户良好的口碑,在未对外规模推广的情况下,很多业务线自主选择使用满天星,满天星使用的年度自然增长的数据非常不错,业务运营频次持续高速增长,这也是满天星希望越来越多的业务能够接入和使用满天星,切实给更多的业务带来提效,这也是满天星平台持续进行能力演进最大的动力。
2. 一些创新的尝试
2.1 内容供给的AIGC创新尝试
面向运营的提效除了提供给运营简易的运营操作界面之外,满天星也尝试和创意生产平台,鲸探等平台进行合作,尝试采用AIGC生成内容的方式为运营同学提供自动化生成的素材,以解决运营同学在素材供给环节所面临的如下问题:
2.2 国际化多语言的快速支撑
满天星灵活的可扩展性设计,在国际化多语言的支撑方面体现出了优势,多语言内容和实验内容一样,本质上都是一种形式的投放内容,已经接入了满天星的小程序、H5、Native、甚至PC页面,如果有页面展示的国际化要求,业务上原则上这块是不需要有任何接入成本的,只需要通过配置的方式即可实现国际化多语言展示,效果展示如下:
3. 提效模式的最佳实践
3.1 助力业务增长的最佳实践
满天星能力的演进离不开业务的需求驱动,早期小荷包的运营同学对满天星提出了很高的要求,同时也贡献了很好的建议,满天星能力和体验的提升离不开运营同学不停的鞭策,小荷包丰富的运营玩法也为平台的能力丰富起到了不可磨灭的作用,同时也充分发挥了平台对业务增长的助力作用。希望这样的经验也能为其他平台的建设过程提供一定的参考和可复制的落地经验。
3.2 配置化服务端免研的最佳实践
满天星平台在做很多新的创新尝试时,往往会投入大量的人力成本进行初期产品的建设,最终如果业务未达到预期的效果,那么这样的前期投入无疑是带来了很大的资源浪费。例如遇到的针对培训行业建设的打工人中心,要做这样的业务需要一套完备的的招选搭投的体系来支撑,如果一开始就投入大量的人力构建招选的体系,这样面客的时间将被大大延长,耽误业务增长的时间,完全可以用最小的代价快速搭建出产品原型,精选行业进行精细化的运营,当业务的增长符合预期时,再进行招选体系的建设扩大行业引入规模。基于这个思路,满天星平台采用了后端零研发纯搭建的方式支撑了产品的快速面客。
3.3 灵活页面搭建的最佳实践
上文中举了支付宝老年版和普通版的例子,在实际接触的业务中也有大量这样的case,比如红包AIGC阵地、红包互动营销场等。比如针对520红包业务期望的页面呈现内容和常态化AIGC呈现的内容是不一样的,再比如和福州数字化中国的合作需要展示福州特色的内容,以及后续和各地的文旅合作,每个地方要展示的内容都是千差万别的,完全可以通过同一模块快速实例化裂变搭建出场和阵地,结合千人千面的运营策略注入,实现完全免研,为业务的快速拓展提效。