带你读《企业数字化基石-阿里巴巴云计算基础设施实践》推荐序二

简介: 《企业数字化基石-阿里巴巴云计算基础设施实践》推荐序二

阿里巴巴基础设施的前身可以追溯至 2009年,振飞(今阿里巴巴合伙人、高德总裁)作为救火队员奉命组建淘宝技术保障部,那一年是天猫双    11的第一个年头,也是阿里云成立的元年。那时候振飞面临的是焦头烂额的稳定性问题,淘宝交易的可用率还不到 39,当时 IOE架构在可扩展性、成本效率、故障颗粒度方面,已难以满足淘宝和支付宝蓬勃发展的需求。在 2010年预算会议上,王坚博士要求在开PPT2010 年不增加小型机的基础上,增加一个,成为2010 年不再增加小型机,启动了阿里巴巴去 IOE 的进程,我参与其中并于 2013 5 月亲自见证了支付宝最后一台 IBM小型机下线。这标志着阿里巴巴小型机时代的终结和基础设施新时代的开篇。

云计算业务的快速发展,为基础设施带来的挑战越来越大。20119月至 2013年年初,以淘宝技术保障部为基础,分期将阿里云、B2B及支付宝运维团队整合为阿里巴巴技术保障部,为阿里巴巴集团技术基础设施的大统一奠定了基础。20141 月,基础设施技术峰会首次召开,主题是传统走向未来,奠定了基础设施技术发展的策略。20147月,阿里巴巴技术保障部更名为AISAlibabaInfrastructureService,意味着基础设施的定位已从保障业务稳定性部门升级为技术驱动的商业基础设施服务商,从保障转型为研发和运营,成为云计算的大底座。同年我们启动了全球人才招聘,正式在人才和组织上要向世界一流水平看齐。

“拼命搞技术“快来不及了(影响云业务)!我们(基础设施技术发展)最多还有 1 2 年时间,这两句话一直环绕在我的心头,从最开始的张北自建数据中心、自研 AliFlashAIS人沿着技术研发的道路,从白盒化到架构一体化,经过 5年的努力,无论是在数据中心、服务器、网络方面,还是在计算、存储、互联方面,我们在各个专业领域都有了长足的进步。从底层的机房电力设备到网络通信的硅光模块,到数据中心的网络架构、自研交换机和 OS,到计算芯片、存储控制器,再到运维管控的 3 分钟故障恢复1 分钟故障发现、1 分钟故障定位、1 分钟故障恢复,再到数据中心的运营大脑(包括供应链等,我们收获了不少的成功,也经历了很多血和泪的教训。

技术基础设施是如此的重要,遗憾的是,因为专业领域众多,一直没有一本跨领域、跨专业的书,因此,我们决定在公司内部材料基础设施白皮书的基础上,编撰一本适用于对外的书。本书也融入了这些年来我们在关键技术决策中的思考和沉淀的经验。期望本书的出版能够给业界带来一块璞玉,以供斧正,同时也鞭策我们自己在未来更进一步。



image.png


 

阿里巴巴集团副总裁基础设施事业部负责人

2019 12 月于杭州


相关文章
|
2月前
|
运维 持续交付 云计算
深入解析云计算中的微服务架构:原理、优势与实践
深入解析云计算中的微服务架构:原理、优势与实践
70 1
|
3月前
|
Kubernetes Cloud Native 持续交付
云计算的转型之路:云原生技术的崛起与实践####
【10月更文挑战第16天】 本文深入探讨了云原生技术在现代IT架构变革中的核心作用,不同于传统概述,本摘要将聚焦于云原生如何促进企业实现敏捷开发、弹性伸缩及高效运维,通过具体案例分析展现其在实际业务场景中的创新应用,揭示这一技术趋势对企业数字化转型的深远影响。 ####
62 2
|
2月前
|
云安全 存储 监控
云计算安全:AWS与Azure的安全策略与实践比较
【10月更文挑战第26天】本文详细比较了AWS和Azure在安全性方面的策略和实践,涵盖身份与访问管理、数据加密与保护以及安全监控与响应。通过代码示例展示了两家云服务提供商在实际应用中的具体操作,帮助企业在选择云服务时做出明智决策。
51 0
|
2月前
|
人工智能 边缘计算 云计算
2024.11|云计算行业的商业模式创新方法及实践
截至2024年,全球云计算行业迈入全新阶段,从IaaS到大规模AI模型平台,技术与商业模式不断创新。本文分析全球最新技术进展,探讨云计算商业模式创新策略与实践,解析云服务厂商如何通过技术革新实现价值最大化,推动企业数字化与智能化转型。重点讨论AI与云计算的深度融合、边缘计算与去中心化发展、平台化与生态系统建设,以及数据安全与绿色云计算等关键议题。
107 30
|
2月前
|
运维 监控 持续交付
云计算环境下的运维自动化实践
本文探讨了在云计算环境下实施运维自动化的必要性、挑战及解决方案,重点介绍了如何利用现代技术工具实现高效的云资源管理和监控。通过具体案例分析,展示了自动化运维在提升系统稳定性、降低人力成本方面的优势。
|
2月前
|
云安全 监控 安全
云计算环境下的网络安全策略与实践
在数字化时代,云计算已成为企业和个人存储、处理数据的重要方式。然而,随着云服务的普及,网络安全问题也日益凸显。本文将探讨如何在云计算环境中实施有效的网络安全措施,包括加密技术、访问控制、安全监控和应急响应计划等方面。我们将通过具体案例分析,展示如何在实际场景中应用这些策略,以保护云中的数据不受威胁。
|
2月前
|
弹性计算 监控 大数据
云计算中的弹性伸缩:原理与实践
云计算中的弹性伸缩:原理与实践
|
2月前
|
存储 算法 调度
云计算环境下的性能优化实践
云计算环境下的性能优化实践
|
2月前
|
云安全 存储 监控
云计算安全:AWS与Azure的安全策略与实践比较
【10月更文挑战第27天】本文对比分析了AWS和Azure在云计算安全领域的策略与实践,涵盖技术、定价、混合云工具等方面。通过代码示例展示了如何在两个平台上实施安全措施,如监控告警、数据加密和身份管理。总结了两者的优缺点,帮助读者根据具体需求选择合适的云服务提供商。
49 4
|
2月前
|
Cloud Native 持续交付 云计算
云计算的转型之路:探索云原生架构的崛起与实践####
随着企业数字化转型加速,云原生架构以其高效性、灵活性和可扩展性成为现代IT基础设施的核心。本文深入探讨了云原生技术的关键要素,包括容器化、微服务、持续集成/持续部署(CI/CD)及无服务器架构等,并通过案例分析展示了这些技术如何助力企业实现敏捷开发、快速迭代和资源优化。通过剖析典型企业的转型经历,揭示云原生架构在应对市场变化、提升业务竞争力方面的巨大潜力。 ####
37 0