如何提高阿里云上应用的可用性(一)

简介: 如今,开发并上线一款应用十分方便。因为云计算提供了从最基础的计算资源如服务器网络、数据库服务、中间件PaaS平台到各种应用支撑的云管理服务,同时开源社区的迅猛发展也提供了从数据库、缓存到应用全生命流程中各种必须的组件,所以越来越多的应用开发者可以把精力放在业务创新上。

如今,开发并上线一款应用十分方便。因为云计算提供了从最基础的计算资源如服务器网络、数据库服务、中间件PaaS平台到各种应用支撑的云管理服务,同时开源社区的迅猛发展也提供了从数据库、缓存到应用全生命流程中各种必须的组件,所以越来越多的应用开发者可以把精力放在业务创新上。然而另一方面,应用所依赖的大量的IaaS、PaaS、Cloud API和开源组件无疑增加了应用的复杂度,如何保障云上应用的可用性,成了用户越来越关注的话题。

保障云上应用的可用性的第一步,是需要知道你的应用长什么样子,用了哪些云服务和开源组件,运行的环境是怎样的,服务之间的依赖如何,必须把它可视化出来,并且持续的跟踪变化。

阿里云最新发布的应用高可用服务,针对云原生应用架构复杂,变化快的特点,推出了架构感知的功能模块,可以非常方便的跟踪展现你在云端的应用架构,接下来我们一起看一下接入的全过程。

_2018_10_31_11_38_38

第一步

登陆阿里云官网搜索“应用高可用服务”, 或者直接输入https://www.aliyun.com/product/ahas 打开产品首页,点击“立即开通” 开通公测服务。新用户第一次进入控制台后,可以选择查看demo来了解产品的基本功能,或者进行RAM授权,然后进入到安装探针来自动感知应用架构的流程。

完成授权后,就进入到探针安装流程,选择环境,默认支持阿里云ECS环境,然后界面会列出你在该region下所有的VPC网络的ECS机器,勾选需要探知的ECS并安装AHAS探针,完成安装后AHAS探针就会开始检测识别你的应用环境中各个进程、各容器和所使用的各种云服务。 同时基于网络流量构建出应用进程之间,容器之间以及ECS之间的网络依赖关系。

image

第二步

安装Java agent(可选), 安装Java Agent可以对应用架构中的Java应用进行动态增强,提供接口级别的性能指标和限流降级能力,根据Java应用所在的环境不同,AHAS提供了普通Java应用, docker和docker compose方式下Java应用加载Java agent的方式安装完之后就可以进入"架构感知"查看实时的架构数据。

安装完之后就可以进入"架构感知"查看实时的架构数据,以下是图例。

所有有网络连接的进程和其之间的网络关系拓扑图

1541043029621_aef584b0_921f_4466_a79b_1f3c49753b42

进程的详细信息及其依赖关系

1541043058464_0714a935_cb25_4f29_ace3_c8a6ee56160c

点击跳转到相关联的进程

1541043101731_890cbc00_3ade_423c_8435_aa8152d47ffa

进程所在的Docker容器

1541043116372_c42f80ce_997d_491a_9483_970a8cccd7fb

进入该容器

1541043131440_2df38f6c_c1eb_4104_b507_c2797435f391

Docker容器所在的主机

1541043144522_c21b8fdc_66ba_4057_90c3_508b24475702

点击进入该主机

1541043158097_5c089c7e_3308_44ad_86fe_bd77075cb379

欢迎加入企业级互联网架构交流钉钉群,群号:21704851

相关文章
|
负载均衡 关系型数据库 RDS
良好架构设计中的可靠性:高可用、容错、灾难恢复
良好架构设计支柱 云计算良好架构设计有五大支柱,分别是:安全性,可靠性,性能效率,成本优化和卓越操作。其中可靠性是指系统从基础设施或者服务故障当中实现恢复、以动态方式获取计算资源以满足需求,以及缓解配置错误或者暂时性网络问题等干扰因素的能力。
4674 0
|
3月前
|
运维 监控 负载均衡
什么是系统可用性?如何提升可用性?
本文探讨了系统可用性的概念、计算方法及其重要性。可用性指系统能在预定时间内正常运行的比例,计算公式为:(运行时间)/(运行时间+停机时间)。文章列举了不同级别的可用性对应的停机时间,并介绍了提升系统可用性的多种策略,包括冗余设计、故障检测与自动恢复、数据备份与恢复、负载均衡、容错设计、定期维护与更新及使用高可用性云服务和网络优化。这些措施有助于构建更加稳定可靠的系统。
380 0
|
存储 运维 容灾
容灾的架构分析和容灾选择策略
容灾的架构分析和容灾选择策略
容灾的架构分析和容灾选择策略
|
6月前
|
存储 关系型数据库 数据库
云数据库如何确保数据的安全性和可靠性?
云数据库如何确保数据的安全性和可靠性?
187 0
|
缓存 运维 监控
稳定性与高可用保障的工作思路
稳定性与高可用保障的工作思路
140 0
|
存储 Kubernetes Java
K8s集群稳定性提升手段
K8s集群稳定性提升手段
K8s集群稳定性提升手段
|
存储 Cloud Native 云计算
高可用性的多云策略成本高昂
高可用性的多云策略成本高昂
189 0
高可用性的多云策略成本高昂
|
存储 缓存 监控
3+1保障:高可用系统稳定性是如何炼成的?
影响系统稳定性的架构设计有哪些?一个可持续保障的研发运维流程机制是怎样的?如何培养团队技术人员的意识和能力?本文作者以团队技术负责人的视角,从三大技术要素和一个业务要素,分享在稳定性建设上的实践性思考和简要思路。希望对同学们有所启发。
3+1保障:高可用系统稳定性是如何炼成的?
|
监控
SLA服务可用性4个9是什么意思?怎么达到?
SLA:服务等级协议(简称:SLA,全称:service level agreement)。是在一定开销下为保障服务的性能和可用性,服务提供商与用户间定义的一种双方认可的协定。通常这个开销是驱动提供服务质量的主要因素。
864 0
|
OceanBase 数据库 关系型数据库
在「不可靠」硬件上,分布式数据库如何保证数据可靠性和服务可用性?
“数据不能丢,服务不能停”,OceanBase作为一款成熟的企业级分布式数据库,基于普通PC服务器,就能够做到传统高端硬件环境下的数据可靠性和服务可用性,而且还能做得更好。
1624 0
在「不可靠」硬件上,分布式数据库如何保证数据可靠性和服务可用性?