蚂蚁金服的资深技术专家石世群:支付宝亿级APP的性能稳定性优化及运维实践

简介: 8月30-31日20:00-21:30,一场别开生面的技术大会—— “蚂蚁金服&阿里云在线金融技术峰会”将在线举办。本次将聚焦数据库、应用架构、移动开发、机器学习等热门领域,帮助金融业技术开发者深入解析互联网应用的前沿应用与技术实践。

8月30-31日20:00-21:30,一场别开生面的技术大会—— “蚂蚁金服&阿里云在线金融技术峰会”将在线举办。本次将聚焦数据库、应用架构、移动开发、机器学习等热门领域,帮助金融业技术开发者深入解析互联网应用的前沿应用与技术实践。

蚂蚁金服&阿里云在线金融技术峰会专题: https://yq.aliyun.com/activity/109
峰会统一报名链接:http://yq.aliyun.com/webinar/join/38

来自蚂蚁金服的资深技术专家石世群 ,将在本次峰会中为大家带来《支付宝亿级APP的性能稳定性优化及运维实践》的分享,下面是议题详情,供大家参考。

议题名称:《支付宝亿级APP的性能稳定性优化及运维实践》

议题简介:在用户规模快速增加,从工具型APP到线下、社交场景化超级APP的转变过程中,支付宝APP在性能稳定性上,面临了很多巨大的挑战,并实际发生过一些痛苦的线上事件。

总结这些关键的经历,我们在稳定性、性能、电量、流量、内存及存储等方面,建立了实际可量化的衡量标准,并通过实时监控、远程诊断及异常熔断&自动恢复、热修复等创新的技术手段,大幅度提高感知发现、定位、解决问题的速度和质量,最终构建适合支付宝这个超级APP的一套运维体系。

本专题主要涵盖

1) 实践检验过的稳定性、性能、电量、流量、内存及存储的度量方法。

2) 稳定性、性能、电量、流量、内存及存储等问题有效的诊断方法。

3) 从全局架构的角度,如何建立一套移动APP的性能稳定性运维体系。

关于分享者:石世群(花名钟鹞),蚂蚁金服资深技术专家,2009年加入支付宝,完整经历并参与了支付宝从产品型APP、平台型APP最终到超级APP的架构演进过程,主导了新一代开放、动态化及高可用、高性能、高灵敏度的技术架构,包括大规模应用的服务框架、模块化容器、APP运维等。目前主要负责支付宝APP性能优化及稳定性提升,构建适合超级APP的运维体系,覆盖稳定性、性能、电量、流量、内存及存储等方面从实时监控、远程诊断到异常熔断恢复的全部过程。

2016年8月30日晚20:00,石世群将在蚂蚁金服&阿里云在线金融技术峰会上发表《支付宝亿级APP的性能稳定性优化及运维实践》的演讲。为了帮助大家更好地了解石世群、评估本次演讲,云栖社区对石世群进行了采访。

以下是采访内容:

云栖社区:能否简单介绍一下支付宝APP,整个客户端架构的演进过程?

石世群:支付宝APP这五六年来,整个技术架构发生了非常大的变化,总体发展,是从产品型应用到平台型应用,再到超级APP应用这样一个发展阶段。我记得2010年刚刚出来第一版支付宝的时候只有三个功能,看账户、充话费、交易,目前市面上大概80%以上APP,技术架构都是这样一个分层、单体的应用。2013年、2014年过渡到平台型应用,一个明显的变化是以前有20个人做客户端,突然一下子公司的重点过来了,有100多个人全部做无线,这个阶段的特点已经变成了承载整个公司多应用的平台,当时一个很重要的技术架构的变动,就是通过服务化和模块化的方式,把整个大团队的并行开发支撑起来,让整个公司都能在这个平台上玩起来。

回到2015年到2016年,我们发现现在所看到的手淘或者是支付宝,已经不是单独的应用,背后是一群应用,这些应用除了在手淘有插件,在支付宝有插件,还有独立APP,已经变成了一个多应用的生态。

对开放的要求越来越高,以前我们支持好集团内部的就可以了,接下来有很多生态伙伴要进来,这个时候技术上需要提供统一标准化的方法,让这些新的应用能够进来并且协同快速成长,保证好开发效率和体验质量,从以前相对封闭的状态演变成合理开放的状态。

  • 动态化,现在业务变化越来越快,恨不得今天评需求,明天开发完,后天上线,而且能够分发到恰当的用户手上去,然后当需要发生某种变更,还要求几乎实时地反应到客户端上来,不可能再依赖于着一个固定的发布点和固定的周期。这里对于动态化技术的多层次、灵活性和精确度,提出了很高的要求。
  • 高可用、高性能、高灵敏度。以前外面如果有风吹草动的时候基本上没有感知的,但是在超级APP里要重点关注高灵敏度,一旦外面有风吹草动,我们可以很快地感知反映出来。

云栖社区:性能稳定性优化上,支付宝有哪些独特的技术和优秀的实践?

石世群:去年1年,我们在支付宝APP的性能稳定性上下了很多的功夫,突破了很多业界的技术难点,取得了卓越的成果。包括在性能、电量、流量和内存上,都取得很大的突破。我们对内部的模块化quinox容器支持按需加载,并作了很大幅度的性能调优。在虚拟机层面,对dalvik vm进行深度调优,比如按需要关闭jit,安装后首次启动或使用时去dexopt等等。流量上对RPC、底层网络协议也进一步精简和治理。

云栖社区:类似支付宝这样的超级APP来说,未来性能稳定性上,架构层面有什么考虑?

石世群:仅仅做这些性能稳定性上单点的优化,短期效果是非常突出的,但是还远远不够。总结这些关键的经历,我们在稳定性、性能、电量、流量、内存及存储等方面,建立了实际可量化的衡量标准,并通过实时监控、远程诊断及异常熔断&自动恢复、热修复等创新的技术手段,大幅度提高感知发现、定位、解决问题的速度和质量,最终构建适合支付宝这个超级APP的一套运维体系。

相关文章
|
13天前
|
数据采集 运维 Cloud Native
Flink+Paimon在阿里云大数据云原生运维数仓的实践
构建实时云原生运维数仓以提升大数据集群的运维能力,采用 Flink+Paimon 方案,解决资源审计、拓扑及趋势分析需求。
17230 18
Flink+Paimon在阿里云大数据云原生运维数仓的实践
|
3天前
|
运维 Kubernetes 安全
容器化技术在现代运维中的应用与挑战
【7月更文挑战第19天】随着云计算和微服务架构的兴起,容器化技术已经成为现代运维工作的重要组成部分。本文将探讨容器技术如何简化运维流程、提高效率,并分析在实际应用中遇到的挑战及解决方案。我们将深入讨论Docker和Kubernetes等工具的使用场景,以及如何在保障系统安全的同时,实现快速部署和扩展。
|
2天前
|
运维 监控 Kubernetes
容器化技术在现代运维中的应用与挑战
【7月更文挑战第21天】随着微服务架构的兴起,容器化技术成为现代运维不可或缺的工具。Docker和Kubernetes等技术的广泛应用,不仅提升了部署效率和应用的可移植性,还带来了新的运维模式。然而,容器安全、性能监控和自动化管理等问题也随之凸显。本文将深入探讨容器化技术的应用实践和面临的主要挑战,为运维人员提供策略和建议。
16 3
|
2天前
|
存储 运维 安全
容器化技术在现代运维中的应用与挑战
【7月更文挑战第21天】随着云原生技术的飞速发展,容器化已成为现代运维不可或缺的一环。本文将深入探讨容器技术的核心优势,分析其在运维自动化、微服务架构及持续集成/持续部署(CI/CD)流程中的关键作用,同时识别并讨论容器化实施过程中遇到的主要挑战,包括安全性问题、存储与网络配置的复杂性以及状态管理等难题。通过案例分析,我们旨在为读者提供容器化技术在运维领域应用的全面视角,并指出未来发展趋势。
|
8天前
|
运维 监控 Devops
DevOps(Development和Operations的组合)是一种强调软件开发(Dev)和信息技术运维(Ops)之间协作与沟通的文化、方法和实践。
DevOps(Development和Operations的组合)是一种强调软件开发(Dev)和信息技术运维(Ops)之间协作与沟通的文化、方法和实践。
|
9天前
|
运维 监控 安全
DevOps文化下的高效运维实践
【7月更文挑战第14天】在软件开发与运维日益融合的今天,DevOps不仅仅是一种技术实践,更是一种文化的转变。本文将探讨如何在DevOps文化的引领下,通过一系列高效运维的策略与工具,实现持续集成、持续部署和持续监控,进而提高软件交付的速度与质量。我们将从自动化、监控、日志管理、容器化以及安全等方面展开讨论,旨在为读者提供一套完整的高效运维解决方案。
|
9天前
|
运维 Prometheus 监控
自动化运维工具链的搭建与优化实践
【7月更文挑战第14天】在现代IT架构中,自动化运维已成为提升效率、保障系统稳定性的关键。本文将深入探讨如何构建一套高效的自动化运维工具链,涵盖从基础设施自动化到应用部署的全过程。我们将分享一系列实用的策略和步骤,旨在帮助读者实现运维工作的自动化,减少人为错误,提高响应速度,最终达到降低运维成本和提升服务质量的双重目标。
39 2
|
10天前
|
机器学习/深度学习 运维 安全
智能化运维:利用机器学习技术优化IT基础设施管理
在信息技术迅猛发展的今天,传统的运维管理模式已难以应对日益复杂的IT基础设施。本文探讨了如何通过集成机器学习技术到运维流程中,实现智能化的运维管理。文章首先介绍了智能化运维的概念及其必要性,随后详细阐述了机器学习在故障预测、自动化处理和安全防护等方面的应用,并通过具体案例展示了智能化运维的实际效果。最后,讨论了实施智能化运维时可能遇到的挑战及未来发展趋势。
44 2
|
7天前
|
机器学习/深度学习 人工智能 运维
智能化运维:未来技术趋势与挑战
随着信息技术的飞速发展,智能化已成为推动运维领域进步的重要力量。本文将深入探讨智能化运维的核心技术、面临的挑战以及未来的发展趋势。通过分析当前运维自动化的实践案例和智能算法的应用,揭示智能化运维如何优化系统性能、提高资源利用率,并预测其对未来IT基础设施的影响。文章旨在为读者提供对智能化运维全面而深入的理解,并为运维专业人士指出未来发展的方向。
16 0