把十万家药店搬到云上是一种怎样的体验?
在海云健康的后台上,每一分钟就有10万笔的买药订单。这家创办于2013年的武汉公司,为全国上十万家连锁药店提供基于CRM的会员系统支持。
“全国每5个人里,就有1个人在接受海云健康系统提供的服务。”如今,海云的业务系统稳稳地跑在阿里云上,为超过3亿用户提供服务支持。
01云梯的渴望
早在数年前,海云业务就进入了“数据驱动”的时代。
以常见的维C为例,不同的生产厂家、不同的剂量、适合搭配什么药物……在海云的系统里,只需要0.001秒,就可以生成最佳推荐结果,既能够帮助药店降低库存,又能让消费者更精准地购买到合适的药物。
老年人的慢病药,经常吃着吃着就忘了。普通药停几天还好,控制血压、血糖、心脏的药,一旦停药后发病就非常危险。针对这种客户,海云帮助药店搭建的系统会定向提醒,通知店员和客户提前备好药,这背后都需要数据驱动。
“我们的数据体量已经堪比一家互联网公司了。这些复杂数据的关联要如何挖掘?我们很早就把目标瞄准了云。”海云技术副总裁袁冲说。
海云技术副总裁袁冲
然而,上云并没有想象中那么美好。早年间,海云第一次尝试将系统迁移到云上。
海云当时遇到了几个困难,最早的技术架构并不是为云设计的,迁移后没有做改造,故障时有发生,影响业务连续性。当时海云采用的某本地云厂商很难提供及时有效的响应,运维效率不尽人意,其架构也难以适应系统迭代、业务创新的需求。
经过短暂的尝试,海云决定回到自建体系,对上云有了新的共识:时机还不成熟,要做的改造太多。
经过疫情洗礼的2020年,数字化成为时代最大的确定性,身处武汉的海云更是深感数字浪潮迎面而至。
疫情过后,药店成为社区服务的刚需,尤其在武汉,竞争加剧,迫使越来越多药房加强精细运营、重视会员管理,海云原有的业务量激增,微服务定制需求纷至沓来。伴随用户和数据量的猛增,海云需要一条更稳健的“云梯”,攀上更高的业务台阶。
“我们都知道阿里云有很好的云产品、数据库和大数据计算引擎,但是我们需要和最了解云的人,一起才能完成这件事。因为这不是研发,而是在真实的业务系统里完成切换。”
02 一边做迁云,一边做下云
阿里云的技术服务工程师进场后发现,情况并不乐观。
海云业务复杂,超过100项微服务、4亿张表单、逾10亿订单都在自建的系统上,为保证业务无影响,割接窗口期仅有8个小时;在业务层面,上百个微服务应用都没有清晰的拆分,日常系统的水位也非常高,资源使用率经常接近100%。
“我们提出采用容器和PolarDB解决业务高峰的弹性问题;利用Hologres存储引擎强大的查询与分析能力,结合DataWorks的实时业务数据同步,提升海云的数据挖掘能力。”阿里云工程师何林波说。
在袁冲看来,上云不仅是传统IT的替代,做好了,更是一次完整的能力飞跃。看了完整的迁云方案,袁冲还是不放心,去了一趟杭州阿里园区。正是这次参观交流,让海云下定决心迁云。
在阿里园区的会议室,何林波和同事们请来了产研团队现场解答。袁冲看到,迁云方案是阿里当年沿用、改进而来,帮助海云迁云团队的技术专家则是技术领域里的核心人物,很多人都是拥有丰富实战经验,经历过最后一台小型机下线、双11、全业务上云等里程碑的专家。
“你们自己都在这么用,我就放心了。”
为了彻底打消客户的顾虑,技术服务团队在协助海云系统上云的同时,做了一个下云回滚的方案。数据所有权归属客户,严格保障数据安全。
“客户(药店)的业务太重要了,事关百姓健康,必须敬畏。”袁冲说。
03 这次,上对云了
一旦决定,接下来就看执行力。位于武汉光谷的“百日迁云攻坚战”正式打响。
2021年1月30日晚上9点,城市里大多数药房已经关店。在海云的办公室里,最繁重的数据割接正式开始。
2021年1月30日深夜,最后一个系统割接现场
表单、应用,不断地从本地开始流向云端。每一次操作,双方都按照预案反复检查,数据是否能对得上,不大的会议室里响起此起彼伏的对话。
双方团队在迁云攻坚逐渐形成默契,“最近还有什么没解决的问题”成为像“吃了么”一样频繁的问候。
“最关键的那一天,虽然有完备预案,但我们还是很担心的,担心就容易饿,一晚上吃了4次夜宵。”阿里云工程师王诗说。
直到第二天凌晨6点,最后一个系统割接完成,主系统顺利完成搬迁,项目组松了口气。袁冲手一挥:“走,吃饺子去。”不知道是谁找来了一口小锅,工程师们凑在办公室一起煮了顿饺子。
最终,海云全部应用得以平滑迁至阿里云,且全过程零故障、对业务零影响。迁云后,系统支持峰值200-300QPS的并发高级查询,有效支撑了众多中小连锁店客户会员的分析查询需求,也避免了原来Kudu+kafka+ES等架构使用与维护的复杂性。
“阿里云有更成熟的产品、更高可用的架构设计,更令我印象深刻的是你们服务过程中的专业与执着。”袁冲说。
除了日常驻场服务,阿里云还提供了7*24小时的钉群值班支持。“我们就像是一个团队,有时遇到运维问题,提工单或钉群留言,基本几分钟就会有阿里同学回复,一对一的支持让我很放心。”
迁云服务结束后,由于项目复杂,还有一些收尾工作。为了帮助客户,阿里云工程师吴向银和同事们继续保留了企业群,直到支撑项目整体顺利迁移。
此外,考虑到稳定性与可用性的平衡,阿里云为海云设计了多云架构,帮助其低成本实现系统的高可用保障及弹性扩容能力,并引入DMS、DAS等产品服务,复杂查询的响应时间提升了近百倍。海云的工程师直观感受是加班变少了,运维的工作量减少了。
“这次,上对云了。”
药店是医疗体系的末梢,也是最重要的一环。中国最早的药店可追溯到宋代的官药局,现代意义上最早的连锁药店,诞生在1995年的广州,经过20年的发展,目前全国药店门店数超过50万家。
在云计算的加持、数据智能的驱动下,海云逐渐发展为一家产业互联网公司,业务也从药店SaaS服务走向慢病管理、智慧健康等更加广阔的赛道。
从犹豫尝试,再到迁云成功,海云得以更专注于精细化的业务创新,近十万B端药店用户、3.6亿C端用户也由此享受到云原生技术带来的顺滑体验。
“阿里云让我们再无后顾之忧。底座稳了,路自然能走更远。”
备注:来源| 阿里云公众号