阿里速度! SRE团队全力保障多地健康码顺利上线-阿里云开发者社区

开发者社区> SRE团队技术小编-小兰> 正文

阿里速度! SRE团队全力保障多地健康码顺利上线

简介: 如何精准防控,统筹疫情期间的各项工作,有序稳健恢复经济社会秩序,成为当务之急。对此,阿里巴巴快速反应,除各种物资支持、政策响应外,还配合多地政府开发健康码,充分运用大数据手段助力疫情防控和复工复产,实现数字化防疫,让政府相关人员更快速、更清晰、更精准地进行防控管理决策。
+关注继续查看
本文始发于:云栖社区
时间:2020-06-02
原文链接:https://yq.aliyun.com/articles/763340

2020年初,新冠肺炎疫情爆发。春节后,企业要复产,百姓要复工,政府需尽快保障各项工作有序开展。如何精准防控,统筹疫情期间的各项工作,有序稳健恢复经济社会秩序,成为当务之急。对此,阿里巴巴快速反应,除各种物资支持、政策响应外,还配合多地政府开发健康码,充分运用大数据手段助力疫情防控和复工复产,实现数字化防疫,让政府相关人员更快速、更清晰、更精准地进行防控管理决策。

健康码开发期间,SRE团队发挥团队优势,紧急召开专题会议,成立专项应急小组,协调各方资源,并在第一时间赶往各省市,配合相关团队完成资源准备、业务压测、业务优化等工作,保证了多地健康码的顺利上线。健康码上线后,SRE团队持续对各项关键指标数据进行监控,确保健康码应用可以承受业务高峰压力并顺利运作。

1 河南健康码——一“码”当先

河南省疫情防控指挥部依据《国务院应对新型冠状病毒肺炎疫情联防联控机制关于依法科学精准做好新冠肺炎疫情防控工作的通知》等相关法律法规,结合河南省实际情况,制定“健康码”管理办法。项目3月5日正式启动,按照局方要求3月9日上线投入使用,团队接到通知提前一天3月4日第一个到达现场。

团队到现场后,首先梳理资源需求与系统部署架构,提前完成资源开通准备及远程环境准备,以保障其它团队可远程交付。其次评估系统压测目标,并对系统进行多轮多场景压测,压测过程中发现并处置1处业务逻辑问题、3处产品优化、1处APIServer资源瓶颈扩容问题,最终达到压测目标并设置AHAS限流控制保障系统稳定运行。安全方面全部使用https域名证书并接入WAF,对系统安全访问进行加固。运维监控方面接入ARMS、TAC、封神、铜雀等运维监控巡检平台保障系统运行稳定。系统顺利于3月9日18:00正式上线,截至3月15日健康码累计申领人数380W。接下来政府将对全省各市级推广,阿里云SRE团队将继续支持客户保障健康码业务稳定。
image.png

2 海南健康码——一心战“疫”

面对新型冠状病毒肺炎疫情的迅猛爆发,针对海南省精准防控、疫情统筹与经济社会秩序恢复的指导方针,海口市政府与市科工信局等单位立即展开多方协同,要求第一时间上线疫情申报相关应用,即海南省健康一码通应用。这是首个全省健康码应用,政府采取多种方式推广,需要在上线第一周内完成全省900多万市民的注册和使用。

由于海口城市大脑云平台资源已经接近饱和,阿里云SRE-TAM团队紧急召开专题会议,迅速成立专项应急小组,与AM团队一起争分夺秒协调海南其他项目组,完成紧急资源释放、扩容及相关并网,并通过全链路压测、资源的提前储备(ECS、SLB)、应用同步改异步(MQ)、数据库读写分离(RDS)以及业务限流(AHAS)等优化手段,为海南健康码保驾护航。健康码准时上线并向全省推广,在此期间阿里云SRE-TAM团队、应用团队以及AM团队联合进行每日的护航保障,通过个性化运维监控方案实现关键资源、核心实例、业务指标等监控,并进行网络相关保障,确保健康码应用可以承受业务高峰压力并顺利运作。截止3月24日,健康码应用注册使用量达到300万+,预计在4月底注册使用量将超过1000万。该系统将有助于更加科学高效地防范疫情,更好地服务广大人民群众安全,为打赢这场全民战役贡献一份力量!
image.png

图2:海南健康码成果图

3 苏州健康码——阿里速度

为解决大量外来人口返苏复工的管理难题,提升人员流动效率,苏州市政府、苏州市疫情防控指挥部决定上线苏城码(苏州健康码)。阿里云数字政府华东大区江苏团队和集团GR团队、蚂蚁团队、GTS团队和数据智能团队,从接到需求、立项、进场部署仅仅耗时40小时就完成了“苏城码”上线,这是除浙江省外第一个运用阿里数据引擎短时间完成上线的城市,我们充分运用数字化防疫,为中国最强地级市打造便捷、高效的管理模式!

【与时间赛跑,火速拉齐,投入战斗】
客户根据本地情况提出了很多定制化开发的需求,面对客户需求,团队快速分析、展开调研、拿出最终方案,客户最终同意将整个系统部署在苏州城市大脑平台上,充分发挥城市大脑在算力、数据融合方面的强大能力。
image.png

图3:客户现场讨论方案

【不眠不休展开部署】
确定方案之后,项目团队不眠不休,火速在现场展开各项部署,与时间赛跑。数字政府和支付宝团队项目经理在现场合理组织交付节奏和方案实施。数据智能的精兵强将,现场与客户的各个专班展开对接,确定客户各项需求的实施方案。GTS的交付同学精准实施,从硬件到软件的全维度保证了项目上线。

客户对于苏州团队的努力和付出非常感动和认可,苏州市副市长江海同志亲自到现场慰问项目团队,感谢团队成员争分夺秒为苏州全市人民平稳复工复产所做出的努力。
image.png

图4:市领导慰问现场项目团队

【践行客户第一的价值观,组织重保团队力保稳定运行】
2020年2月22日晚9:30分,苏州市疫情防控指挥部正式下发第9、10号公告,在全市正式推广“苏城码”。在公告下发之后的2小时之内完成了40万的健康码发码,平台瞬间流量激增,业务平台受到了极大考验,现场GTS同学密切监控、随时排障,苏州城市大脑平台经受住了考验。
image.png

图5:项目顺利上线

为保证项目能够长期稳定可靠地运行,GTS同学快速拉通GOC团队建立项目重保机制,得到客户首肯。江海副市长和李晶处长现场说,只有把业务放在阿里云上才放心!并且表示要把苏城码在城市通行场景方面做有力探索,让苏城码成为苏州市民通行的电子码。与此同时,也有其他政府部门开始思考苏城码与各自业务的结合,比如园林局考虑是否可以把苏城码和园林的进出和电子票进行结合,加强园林的管理和通行效率。

“一心战一疫”,“客户第一”!借助苏州健康码项目的火速上线,再次刷新了健康码快速上线的速度,既服务了客户,也激发了团队强大的战斗力,同时为数字政府在苏州乃至江苏的破局打下了坚实的基础!

4 上海健康码——健康出行

上海“一网通办”依托移动端“随申办”打造的“随申码”于2月17日试点上线。依托上海市大数据资源平台汇聚的国家及本市公共管理机构数据,经过数据建模、分析评估后,测算出红色、黄色、绿色三种风险状态供参考,赋予“随申码”健康出行、防控管理的相关信息。

结合新冠肺炎疫情防控的需求,随申码的发码与查码量不断攀升,系统负载不断加大,阿里云GTS团队迅速介入,帮助随申码搭建高可用高可靠系统平台。GTS团队用一个晚上的时间快速确定高并发方案,在确认方案后SRE团队基于阿里云中国政务云平台快速为随申码搭建可扩展的高可用云平台,TM和产品研发团队基于云平台部署定制化的数据智能码引擎,并通过全链路压测、应用弹性扩容、基础架构优化、应用逻辑优化、业务限流(AHAS)等优化手段将随申码的并发承载能力提升百倍以上。2月28日8:00阿里云-随申码平台正式上线,承载的用户并发突破万次每分钟,累计查码量突破一千万次,覆盖上海全部的两千四百万人口,并保持不断的产品迭代,在后续的企业码、亲情码业务中持续给与技术和资源支持。
image.png
image.png

图6:项目人员加班加点保障上海随申码上线

我们是阿里云智能全球技术服务-SRE团队,我们致力成为一个以技术为基础、面向服务、保障业务系统高可用的工程师团队;提供专业、体系化的SRE服务,帮助广大客户更好地使用云、基于云构建更加稳定可靠的业务系统,提升业务稳定性。我们期望能够分享更多帮助企业客户上云、用好云,让客户云上业务运行更加稳定可靠的技术,您可用钉钉扫描下方二维码,加入阿里云SRE技术学院钉钉圈子,和更多云上人交流关于云平台的那些事。

image.png

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
4025 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
3963 0
智捷iOS课堂-关东升老师视频 上线了
<p>android应用开发实战</p> <p><img src="http://img.blog.csdn.net/20130502162659870" alt=""> <br></p> <p><a href="http://v.51work6.com">http://v.51work6.com</a></p> <br><p>UML应用开发详解</p> <p><img src="http:/
1044 0
云存储网关集成SLS的网关日志上线
概述 云存储网关6月底商业化之后,在稳定性和性能不断提高的同时,安全和监控方面能力也进一步得到了增强。网关在1.0.39版本集成SLS日志服务输出了网关日志监控,主要解决以下的痛点: 网关提供了近期几天的性能监控图,但是没有查询历史性能数据的接口 前端写入了数据,用户如何能够知晓这些数据何时上云以及上云的响应时间 用户如何审计网关的上云增删改的所有操作 配置 云存储网关日志监控配置操作简单便捷,支持监控项的创建,删除,启用,禁用。
505 0
专访 ShineScrum公司创始人Jim Wang(王军):组织架构会发生颠覆性的变化,自治团队和团队单元会成为主体
对于敏捷领域的未来,Jim指出,将会有以下的变化:持续聚焦于给客户和用户带来附加值和创新为企业的目标;组织架构会发生颠覆性的变化,自治团队和团队单元会成为主体 (Team Organization)……等等
4091 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
5698 0
阿里速度! SRE团队全力保障多地健康码顺利上线
2020年初,新冠肺炎疫情爆发。春节后,企业要复产,百姓要复工,政府需尽快保障各项工作有序开展。如何精准防控,统筹疫情期间的各项工作,有序稳健恢复经济社会秩序,成为当务之急。对此,阿里巴巴快速反应,除各种物资支持、政策响应外,还配合多地政府开发健康码,充分运用大数据手段助力疫情防控和复工复产,实现数字化防疫,让政府相关人员更快速、更清晰、更精准地进行防控管理决策。
98 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
2901 0
24
文章
0
问答
来源圈子
更多
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载