蚂蚁金服的资深技术专家石世群:支付宝亿级APP的性能稳定性优化及运维实践

简介: 8月30-31日20:00-21:30,一场别开生面的技术大会—— “蚂蚁金服&阿里云在线金融技术峰会”将在线举办。本次将聚焦数据库、应用架构、移动开发、机器学习等热门领域,帮助金融业技术开发者深入解析互联网应用的前沿应用与技术实践。

8月30-31日20:00-21:30,一场别开生面的技术大会—— “蚂蚁金服&阿里云在线金融技术峰会”将在线举办。本次将聚焦数据库、应用架构、移动开发、机器学习等热门领域,帮助金融业技术开发者深入解析互联网应用的前沿应用与技术实践。

蚂蚁金服&阿里云在线金融技术峰会专题: https://yq.aliyun.com/activity/109
峰会统一报名链接:http://yq.aliyun.com/webinar/join/38

来自蚂蚁金服的资深技术专家石世群 ,将在本次峰会中为大家带来《支付宝亿级APP的性能稳定性优化及运维实践》的分享,下面是议题详情,供大家参考。

议题名称:《支付宝亿级APP的性能稳定性优化及运维实践》

议题简介:在用户规模快速增加,从工具型APP到线下、社交场景化超级APP的转变过程中,支付宝APP在性能稳定性上,面临了很多巨大的挑战,并实际发生过一些痛苦的线上事件。

总结这些关键的经历,我们在稳定性、性能、电量、流量、内存及存储等方面,建立了实际可量化的衡量标准,并通过实时监控、远程诊断及异常熔断&自动恢复、热修复等创新的技术手段,大幅度提高感知发现、定位、解决问题的速度和质量,最终构建适合支付宝这个超级APP的一套运维体系。

本专题主要涵盖

1) 实践检验过的稳定性、性能、电量、流量、内存及存储的度量方法。

2) 稳定性、性能、电量、流量、内存及存储等问题有效的诊断方法。

3) 从全局架构的角度,如何建立一套移动APP的性能稳定性运维体系。

关于分享者:石世群(花名钟鹞),蚂蚁金服资深技术专家,2009年加入支付宝,完整经历并参与了支付宝从产品型APP、平台型APP最终到超级APP的架构演进过程,主导了新一代开放、动态化及高可用、高性能、高灵敏度的技术架构,包括大规模应用的服务框架、模块化容器、APP运维等。目前主要负责支付宝APP性能优化及稳定性提升,构建适合超级APP的运维体系,覆盖稳定性、性能、电量、流量、内存及存储等方面从实时监控、远程诊断到异常熔断恢复的全部过程。

2016年8月30日晚20:00,石世群将在蚂蚁金服&阿里云在线金融技术峰会上发表《支付宝亿级APP的性能稳定性优化及运维实践》的演讲。为了帮助大家更好地了解石世群、评估本次演讲,云栖社区对石世群进行了采访。

以下是采访内容:

云栖社区:能否简单介绍一下支付宝APP,整个客户端架构的演进过程?

石世群:支付宝APP这五六年来,整个技术架构发生了非常大的变化,总体发展,是从产品型应用到平台型应用,再到超级APP应用这样一个发展阶段。我记得2010年刚刚出来第一版支付宝的时候只有三个功能,看账户、充话费、交易,目前市面上大概80%以上APP,技术架构都是这样一个分层、单体的应用。2013年、2014年过渡到平台型应用,一个明显的变化是以前有20个人做客户端,突然一下子公司的重点过来了,有100多个人全部做无线,这个阶段的特点已经变成了承载整个公司多应用的平台,当时一个很重要的技术架构的变动,就是通过服务化和模块化的方式,把整个大团队的并行开发支撑起来,让整个公司都能在这个平台上玩起来。

回到2015年到2016年,我们发现现在所看到的手淘或者是支付宝,已经不是单独的应用,背后是一群应用,这些应用除了在手淘有插件,在支付宝有插件,还有独立APP,已经变成了一个多应用的生态。

对开放的要求越来越高,以前我们支持好集团内部的就可以了,接下来有很多生态伙伴要进来,这个时候技术上需要提供统一标准化的方法,让这些新的应用能够进来并且协同快速成长,保证好开发效率和体验质量,从以前相对封闭的状态演变成合理开放的状态。

  • 动态化,现在业务变化越来越快,恨不得今天评需求,明天开发完,后天上线,而且能够分发到恰当的用户手上去,然后当需要发生某种变更,还要求几乎实时地反应到客户端上来,不可能再依赖于着一个固定的发布点和固定的周期。这里对于动态化技术的多层次、灵活性和精确度,提出了很高的要求。
  • 高可用、高性能、高灵敏度。以前外面如果有风吹草动的时候基本上没有感知的,但是在超级APP里要重点关注高灵敏度,一旦外面有风吹草动,我们可以很快地感知反映出来。

云栖社区:性能稳定性优化上,支付宝有哪些独特的技术和优秀的实践?

石世群:去年1年,我们在支付宝APP的性能稳定性上下了很多的功夫,突破了很多业界的技术难点,取得了卓越的成果。包括在性能、电量、流量和内存上,都取得很大的突破。我们对内部的模块化quinox容器支持按需加载,并作了很大幅度的性能调优。在虚拟机层面,对dalvik vm进行深度调优,比如按需要关闭jit,安装后首次启动或使用时去dexopt等等。流量上对RPC、底层网络协议也进一步精简和治理。

云栖社区:类似支付宝这样的超级APP来说,未来性能稳定性上,架构层面有什么考虑?

石世群:仅仅做这些性能稳定性上单点的优化,短期效果是非常突出的,但是还远远不够。总结这些关键的经历,我们在稳定性、性能、电量、流量、内存及存储等方面,建立了实际可量化的衡量标准,并通过实时监控、远程诊断及异常熔断&自动恢复、热修复等创新的技术手段,大幅度提高感知发现、定位、解决问题的速度和质量,最终构建适合支付宝这个超级APP的一套运维体系。

相关文章
|
25天前
|
运维 监控 持续交付
构建高效自动化运维体系:策略与实践
在数字化时代,企业IT基础设施的管理和维护变得日益复杂。为了提高效率、降低错误率并快速响应市场变化,构建一个高效的自动化运维体系至关重要。本文将探讨自动化运维的核心策略,并通过实际案例分析展示如何将这些策略应用于日常管理中,以实现IT运维的优化。
15 0
|
4天前
|
运维 Kubernetes Devops
构建高效自动化运维体系:DevOps与容器技术融合实践
【4月更文挑战第15天】 在当今快速发展的信息技术时代,传统的IT运维模式已难以满足业务敏捷性的需求。本文旨在探讨如何通过整合DevOps理念和容器技术来构建一个高效的自动化运维体系。文章将详细阐述DevOps的核心原则、容器技术的基础知识,以及两者结合的优势。此外,文中还将分享一系列实践经验,包括持续集成/持续部署(CI/CD)流程的搭建、微服务架构的应用,以及监控和日志管理策略的优化,以期帮助企业实现快速、可靠且安全的软件交付过程。
|
11天前
|
运维 监控 Kubernetes
构建高效自动化运维体系的实践与思考
【4月更文挑战第8天】在数字化时代,IT基础设施的复杂性日益增加,传统的手工运维模式已经难以满足快速响应和高效率的需求。本文将探讨如何通过自动化工具和策略构建一个高效的自动化运维体系,旨在提高系统的稳定性、减少人为错误以及优化资源分配。文章首先分析了自动化运维的必要性,接着介绍了实现自动化的关键技术和工具,并通过案例分析展示自动化运维体系的实际效果。最后,对自动化运维的未来发展趋势进行了展望。
|
13天前
|
机器学习/深度学习 传感器 运维
提升数据中心效能:智能运维策略与实践
【4月更文挑战第6天】在数字化时代,数据中心作为企业信息架构的核心,其稳定性和效率直接影响到业务连续性和客户满意度。随着技术的进步,传统的数据中心运维模式已经不能满足现代高效、智能化的需求。本文将探讨如何通过智能运维(AIOps)策略,结合大数据分析和机器学习技术,实现数据中心的自动化管理、故障预测及快速响应,以提升整体效能并降低运营成本。
|
16天前
|
数据采集 小程序 网络安全
云擎技术---分析工信部APP备案的“传闻”
APP备案并非新事物,自2005年起已有非经营性互联网信息服务备案制度。备案针对的是网站主办者,而非用户,不涉及个人用户网络访问。网络接入服务提供者包括ISP和IDC,不限于三大运营商。通知要求不为未备案网站提供接入,但不影响国外软件使用。个人开发者不能涉及经营性内容,备案审核时长1-20个工作日。境内服务器和国内应用商店需备案,境外则无需。手机厂商不会开启白名单制,仅实行黑名单制。APP备案与民营经济发展壮大意见不冲突,工信部有权颁布相关规定。该政策不存在逐步试探底线情况,所有解读均有法律依据。
23 3
云擎技术---分析工信部APP备案的“传闻”
|
23天前
|
运维 监控 数据可视化
现代化运维管理系统的关键特性及实践应用
随着信息技术的迅猛发展,现代企业对于运维管理系统的需求日益增长。本文将探讨现代化运维管理系统的关键特性,以及在实际应用中的重要性和优势所在,帮助企业更好地理解和应用现代化运维管理系统。
13 2
|
25天前
|
运维 Prometheus 监控
构建高效稳定的云基础设施:自动化运维策略与实践
在动态的云计算环境中,自动化运维(AIOps)已成为确保服务稳定性和效率的关键。本文将深入探讨构建高效稳定云基础设施的策略,重点关注自动化工具的选择、配置管理的最佳实践、持续集成与持续部署(CI/CD)流程的优化,以及监控和日志分析的重要性。通过这些策略的实施,企业能够减少人为错误,提高响应速度,并最终实现运维效率的显著提升。
|
27天前
|
存储 安全 开发工具
APP安全加固怎么做?加固技术、加固方法、加固方案
APP安全加固怎么做?加固技术、加固方法、加固方案
17 3
|
27天前
|
缓存 安全 Java
提高APP安全性的必备加固手段——深度解析代码混淆技术
提高APP安全性的必备加固手段——深度解析代码混淆技术
20 1
|
27天前
|
运维 监控 Devops
构建高效自动化运维体系:基于容器技术的持续集成与持续部署实践
在数字化转型的浪潮中,企业的IT基础设施和软件交付模式正经历着深刻的变革。传统的运维方式已难以满足快速迭代、灵活扩展的现代业务需求。本文将探讨如何通过容器技术实现高效的自动化运维体系,重点分析持续集成(CI)与持续部署(CD)的实践方法及其对企业运维效率的影响。通过引入微服务架构、容器编排、DevOps文化等概念,我们旨在为读者提供一套全面的自动化运维解决方案,以支持业务的敏捷性和可扩展性。