阿里互联网架构的6大最佳实践

简介:

2016云栖大会上海峰会于2016.1.20日在上海科技馆顺利举办。本文根据阿里中间件首席架构钟华(花名:古谦)在“云栖大会上海峰会”专场《“互联网+”架构及实践专场-企业级信息系统云化演进之路》中的演讲整理。钟华在演讲中主要为大家介绍了阿里技术架构发展概况,以及在阿里在构建互联网级系统架构的6大最佳实践。

古谦首先带领大家回顾了阿里技术架构前期发展状况。在2016年,淘宝的技术架构现状是一个拥有300多个功能的系统,由500多人的技术团队负责维护,该系统基于传应用开发架构,但当时淘宝业务每年翻倍增长。在这样的大背景下,前期的技术架构出现了严重问题:牵一发而动全身,业务支持缓慢。上百人维护一个核心工程,项目发布周期太长,应用处理能力扩展成本高,错误难于隔离,同时也使得数据库能力达到上限。

经过多年实战和不断创新,阿里巴巴逐渐形成了今天自己的核心系统架构(如下图)。古谦介绍说,这不是单一的产品,是很多包括中间件等在内的产品沉淀和体系化的结果。做架构不能考虑当前的一件事情,要从业务持续发展来思考。他特别强调,共享服务体系的建立打破了应用“烟囱式”的垂直建设方式,使得可以支撑业务快速创新,避免IT建设的资源浪费。聚划算就是依靠这样的系统架构与理念,依靠几个人在短时间内完成系统快速上线。

b951af826a245c5236debf5d286a0c6612ff9797

那阿里巴巴在形成今天的互联网级系统架构过程中,遵循着什么样的思路、原则,或者在整个构建过程中,有着什么样的经验值得业界参考呢?古谦在演讲中总结了6个原则:

  • 尽可能拆分
  • 服务架构“去中心化”
  • 异步化
  • 数据化运营
  • 尽可能使用成熟组件
  • 尽可能自动化

具体来说,“尽可能拆分”的意思是要以服务化的方式拆分架构,要做到更好地独立扩展与伸缩,更灵活的部署和隔离错误。“去中心化”的服务架构,与中心化架构诉求是不一样的,“去中心化”的服务架构可以实现服务能力的线性扩展;做到无业务单点,减少故障影响面。

异步化,则是利用异步机制拆分事务,系统解耦合,提升开发效率,不过需要值得注意的一点是要确保系统最终一致。数据化运营,则要真正发挥数据价值,而不是简单提供数据平台;同时尽量注意定位跟踪业务链问题,使得更好的管控“去中心化”服务。越是底层系统,越需要稳定,所以尽可能使用成熟组件,这可以保证在项目出现问题以后有充分的掌控力。

提到“尽可能自动化”时,古谦谈到说,今天很多互联网公司的运维跟不上,导致拖累业务的发展。运维这件事情虽然需要技术人员做,但是百分之八九十工作是可重复的。在运维领域里,人能做的事情机器也一定要做。一旦机器趋于稳定,一定比人可靠。人在做事过程中有情绪,容易出现人工误差。一旦机器规模增大之后,自动化是非常重要的。

“自动化”包括运维标准规范和平台化、弹性伸缩自动化、部署自动化、故障处理自动化。在2015年双11备战中,由于对自动化环境的充分准备,压力测试投入由2000人参与测试降低到了之前人数的1/16,这也大大减少了工程师熬夜次数,使得问题一旦出现就能得到快速响应。

最后,古谦表示说,不管是面对政府客户还是企业客户,我们的产品和服务需要有自己的核心价值。贡献服务理念,可以把核心价值和数据变得足够的稳固,可以面对任何的冲击,需要把我们的能力释放出去。通过能力开放平台,企业自身的数据和核心能力,或者外部第三方平台能够基于自身核心业务能力打造真正的生态。能力开放是新的开放方式,开放出去,对今天“互联网+”转型是真正切实有效的业务上的支撑。

相关文章
|
4月前
|
消息中间件 运维 监控
企业级短信验证码服务架构设计与最佳实践
随着移动互联网的发展,短信验证码成为用户身份验证的重要手段。本文从企业级应用角度出发,探讨如何构建高可用、高并发和安全可靠的短信验证码服务。通过多通道冗余、故障自动切换和服务降级保障高可用性;利用异步处理与消息队列应对高并发;借助多层防刷、内容审核和数据加密提升安全性。同时,提供了详细的架构设计、核心模块代码示例以及监控运维方案,帮助读者理解并实现一个完整的短信验证码系统。
232 2
|
21天前
|
存储 监控 安全
132_API部署:FastAPI与现代安全架构深度解析与LLM服务化最佳实践
在大语言模型(LLM)部署的最后一公里,API接口的设计与安全性直接决定了模型服务的可用性、稳定性与用户信任度。随着2025年LLM应用的爆炸式增长,如何构建高性能、高安全性的REST API成为开发者面临的核心挑战。FastAPI作为Python生态中最受青睐的Web框架之一,凭借其卓越的性能、强大的类型安全支持和完善的文档生成能力,已成为LLM服务化部署的首选方案。
|
7月前
|
监控 Java Nacos
阿里二面:10亿级分库分表,如何丝滑扩容、如何双写灰度?阿里P8方案+ 架构图,看完直接上offer!
阿里二面:10亿级分库分表,如何丝滑扩容、如何双写灰度?阿里P8方案+ 架构图,看完直接上offer!
阿里二面:10亿级分库分表,如何丝滑扩容、如何双写灰度?阿里P8方案+ 架构图,看完直接上offer!
|
6月前
|
存储 NoSQL Redis
阿里面试:Redis 为啥那么快?怎么实现的100W并发?说出了6大架构,面试官跪地: 纯内存 + 尖端结构 + 无锁架构 + EDA架构 + 异步日志 + 集群架构
阿里面试:Redis 为啥那么快?怎么实现的100W并发?说出了6大架构,面试官跪地: 纯内存 + 尖端结构 + 无锁架构 + EDA架构 + 异步日志 + 集群架构
阿里面试:Redis 为啥那么快?怎么实现的100W并发?说出了6大架构,面试官跪地: 纯内存 + 尖端结构 +  无锁架构 +  EDA架构  + 异步日志 + 集群架构
|
消息中间件 缓存 监控
优化微服务架构中的数据库访问:策略与最佳实践
在微服务架构中,数据库访问的效率直接影响到系统的性能和可扩展性。本文探讨了优化微服务架构中数据库访问的策略与最佳实践,包括数据分片、缓存策略、异步处理和服务间通信优化。通过具体的技术方案和实例分析,提供了一系列实用的建议,以帮助开发团队提升微服务系统的响应速度和稳定性。
|
9月前
|
容灾 网络协议 数据库
云卓越架构:云上网络稳定性建设和应用稳定性治理最佳实践
本文介绍了云上网络稳定性体系建设的关键内容,包括面向失败的架构设计、可观测性与应急恢复、客户案例及阿里巴巴的核心电商架构演进。首先强调了网络稳定性的挑战及其应对策略,如责任共担模型和冗余设计。接着详细探讨了多可用区部署、弹性架构规划及跨地域容灾设计的最佳实践,特别是阿里云的产品和技术如何助力实现高可用性和快速故障恢复。最后通过具体案例展示了秒级故障转移的效果,以及同城多活架构下的实际应用。这些措施共同确保了业务在面对网络故障时的持续稳定运行。
|
10月前
|
运维 监控 BI
卓越架构之FinOps最佳实践
本文探讨了云成本管理的趋势和FinOps的最佳实践。随着云计算的普及,传统的IT管理模式已无法适应按需使用和按量付费的新模式,导致企业面临资源浪费和成本失控的风险。FinOps作为一种管理理念,强调运维、财务和技术团队的合作,通过数据驱动和业务价值驱动的方式优化云成本。文章介绍了FinOps的核心挑战、最佳实践及技术工具的应用,帮助企业有效管理和优化云成本,实现降本增效。
|
10月前
|
Kubernetes 安全 数据安全/隐私保护
云卓越架构:容器安全最佳实践
本次分享由阿里云智能集团解决方案架构师张玉峰主讲,主题为“云卓越架构:容器安全最佳实践”。内容涵盖容器安全的挑战、云原生容器安全架构及典型场景。首先分析了容器安全面临的问题,如镜像漏洞和权限管理。接着介绍了容器安全架构的五个维度:身份权限管理、配置安全检查、运行时防护、镜像安全检测及发布的安全管控。最后通过具体场景展示了容器身份与权限管理、密钥管理、运行时防入侵等最佳实践,强调了安全左移的重要性,确保从开发到运行的全生命周期安全覆盖。
|
11月前
|
消息中间件 监控 安全
构建高效微服务架构:最佳实践与挑战
在现代软件开发中,微服务架构因其高度的可扩展性、灵活性和敏捷性而受到青睐。本文深入探讨了构建高效微服务架构的关键策略,包括服务的划分、通信机制、数据管理、部署与监控等方面的最佳实践。同时,文章也分析了在实施过程中可能遇到的挑战,如服务间的依赖管理、数据一致性问题、安全考量及性能优化等,并提出了相应的解决方案。通过实际案例分析,本文旨在为开发者提供一套实用的指南,帮助他们在构建微服务系统时能够有效规避风险,提升系统的健壮性和用户体验。