持续演进的Cloud Native (读书笔记01)

简介: 观察任何一个企业都可以从三个角度出发,这三个角度分别是技术、流程、文化,三个方面都做好才能成为伟大的企业。Cloud Native也一样,需要从架构、研发流程、团队文化三个角度来实现,三者需要相互配合,缺一不可。

Cloud Naive 定义


如果非要给Cloud Native下一个定义,那么我认为,Cloud Native是一系列架构、研发流程、团队文化的最佳实践集合,以此支撑更快的创新速度、极致的用户体验、稳定可靠的用户服务、高效的研发效率。


Cloud Native 组成


观察任何一个企业都可以从三个角度出发,这三个角度分别是技术、流程、文化,三个方面都做好才能成为伟大的企业。Cloud Native也一样,需要从架构、研发流程、团队文化三个角度来实现,三者需要相互配合,缺一不可。Cloud Native的组成,如图


1.png


从架构的角度来讲,Cloud Native是以云和微服务架构为基础构建系统的,这里的云并不一定是公有云,也可以是私有云、混合云,云包含了敏捷基础设施及公共基础服务。除此之外,还需要考虑架构的质量属性。下图为Cloud Native架构的组成


2.png


Cloud Native成熟度模型


3.jpg


Cloud Native 原则


为失败设计原则


  • 从架构的角度讲,为失败设计同样重要,因为失败是不可避免的,我们希望失败的结果是我们预料到的,是经过设计的。
  • 因为失败是不可避免的,所以设计目标是预测并解决这些故障。


不变性原则


  •  实现不变性原则的前提是,基础设施中的每个服务、组件都可以自动安装、部署,不需要人工干预。每个服务或组件在安装、部署完成后将不会发生更改,如果要更改,则丢弃老的服务或组件并部署一个新的服务或组件。替换的速度远远快于修复的速度。


标准化原则


  • 如果我们都采用相同的微服务框架,那么服务之间的调用将变得非常容易。而且,团队间发生人员流动,也不再会因为换了一种框架而需要漫长的熟悉时间。当所有的日志打印都遵循某种标准的时候,对于排除故障,日志分析将非常重要。
  • 独立自主和标准化是一对互斥的原则,独立代表的是灵活、创新,而标准则代表效率、稳定,两者需要权衡。所谓独立自主是在一定的标准下实现的


速度优先原则


  • 效率更像一种“节流”方法,而速度是接近于“开源”的一种手段。当速度和效率发生冲突时,速度优先。


简化设计原则


  • 越是基础的服务,越需要稳定,越需要简化设计、简化运维。简化设计也是Amazon和Netflix的软件设计原则。

自动化驱动原则


  • 任何重复性的工作都应该自动化,只有真正拥抱自动化的时候,才能做到持续发布,才能做到更好的用户体验。

演进式设计原则


  • 架构是持续演进的,并非一蹴而就的。单凭设计阶段很难达到理想的目标,需要不断锤炼。初级阶段应该采用尽可能简单的架构,因为初级阶段对需求、规模等都不是十分确定,可以采用快速迭代的方式进行架构演进。很多互联网公司都强调架构演
相关文章
|
12月前
|
机器学习/深度学习 运维 监控
万亿参数模型训练神器:Kubeflow 2025量子加速版下载与TPU集群配置详解
Kubeflow 2025 是一个云原生机器学习操作系统,实现了四大突破性创新:量子混合训练(支持经典-量子混合神经网络协同计算)、神经符号系统集成(融合深度学习与逻辑推理引擎)、边缘智能联邦(5G MEC节点自动弹性扩缩容)和因果可解释性框架(集成Pearl、DoWhy等工具链)。该平台通过混合计算架构、先进的硬件配置矩阵和量子增强型安装流程,提供了从基础设施预配置到核心组件安装和安全加固的完整部署方案。此外,Kubeflow 2025 还涵盖全生命周期开发实战案例、智能运维监控体系、安全与合规框架以及高阶调试技巧,帮助用户高效构建和管理复杂的机器学习项目。
|
机器学习/深度学习 存储 人工智能
2025年NVIDIA RTX 4090云服务器租赁价格与选型指南
本文探讨了在主流云服务商尚未提供RTX 4090实例的背景下,如何选择高性能GPU服务器。分析了市场现状、替代方案性能,并推荐阿里云的GN7i(NVIDIA A10)、GN6v(NVIDIA V100)等实例,提供了成本优化策略与选型建议,确保用户在AI训练、图形渲染等场景中实现效率和成本的最佳平衡。
|
机器学习/深度学习 人工智能 数据安全/隐私保护
2025年NVIDIA RTX 4090服务器租赁价格与选型详解
随着AI训练、深度学习与图形渲染需求激增,NVIDIA RTX 4090显卡成为算力租赁市场的热门选择。本文从价格体系、配置适配、成本优化三方面解析4090服务器租赁策略,涵盖短租长租价格差异、主流平台对比、硬件配置建议及成本优化方案,助您精准匹配业务需求。此外,还介绍了阿里云高性能GPU实例作为替代方案,提供稳定性和生态集成优势。
|
Android开发
鸿蒙开发:自定义一个简单的标题栏
本身就是一个很简单的标题栏组件,没有什么过多的技术含量,有一点需要注意,当使用沉浸式的时候,注意标题栏的位置,需要避让状态栏。
302 5
鸿蒙开发:自定义一个简单的标题栏
|
存储 缓存 负载均衡
什么是CDN(内容分发网络)?
什么是CDN(内容分发网络)?
9664 7
|
Kubernetes 关系型数据库 网络架构
ray集群部署vllm的折磨
概括如下: 在构建一个兼容多种LLM推理框架的平台时,开发者选择了Ray分布式框架,以解决资源管理和适配问题。然而,在尝试集成vllm时遇到挑战,因为vllm内部自管理Ray集群,与原有设计冲突。经过一系列尝试,包括调整资源分配、修改vllm源码和利用Ray部署的`placement_group_bundles`特性,最终实现了兼容,但依赖于非官方支持的解决方案。在面对vllm新版本和Ray部署的`reconfigure`方法问题时,又需权衡和调整实现方式。尽管面临困难,开发者认为使用Ray作为统一底层仍具有潜力。
|
弹性计算
阿里云服务器升级带宽流程及收费标准参考
阿里云服务器如何升级带宽,升级带宽需要多少钱?对于初次购买阿里云服务器的用户来说,可能并不知道阿里云服务器如何升级带宽,也不清楚升级带宽要多少钱,带宽的收费标准是怎样的,有哪些注意事项,下面小编为大家介绍下。
2166 0
阿里云服务器升级带宽流程及收费标准参考
|
SQL 弹性计算 自然语言处理
AIGC-知识库-LLM:从0开始搭建智能问答钉钉机器人
本文描述在阿里云上从0开始构建个人/企业专属,具备私域知识库+LLM智能问答钉钉机器人。知识库技术方案使用了Lindorm AI数据服务平台知识库能力,LLM使用了开源ChatGLM2-6B。
1761 1
|
弹性计算 人工智能 Linux
『Linux』Linux环境搭建 | 阿里云云服务器白嫖 | Xshell环境配置
『Linux』Linux环境搭建 | 阿里云云服务器白嫖 | Xshell环境配置
『Linux』Linux环境搭建 | 阿里云云服务器白嫖 | Xshell环境配置
|
SQL 存储 关系型数据库
MySQL之面试真题详解
MySQL之面试真题详解
179 1

热门文章

最新文章