如何提高阿里云上应用的可用性(一)

简介: 如今,开发并上线一款应用十分方便。因为云计算提供了从最基础的计算资源如服务器网络、数据库服务、中间件PaaS平台到各种应用支撑的云管理服务,同时开源社区的迅猛发展也提供了从数据库、缓存到应用全生命流程中各种必须的组件,所以越来越多的应用开发者可以把精力放在业务创新上。

如今,开发并上线一款应用十分方便。因为云计算提供了从最基础的计算资源如服务器网络、数据库服务、中间件PaaS平台到各种应用支撑的云管理服务,同时开源社区的迅猛发展也提供了从数据库、缓存到应用全生命流程中各种必须的组件,所以越来越多的应用开发者可以把精力放在业务创新上。然而另一方面,应用所依赖的大量的IaaS、PaaS、Cloud API和开源组件无疑增加了应用的复杂度,如何保障云上应用的可用性,成了用户越来越关注的话题。

保障云上应用的可用性的第一步,是需要知道你的应用长什么样子,用了哪些云服务和开源组件,运行的环境是怎样的,服务之间的依赖如何,必须把它可视化出来,并且持续的跟踪变化。

阿里云最新发布的应用高可用服务,针对云原生应用架构复杂,变化快的特点,推出了架构感知的功能模块,可以非常方便的跟踪展现你在云端的应用架构,接下来我们一起看一下接入的全过程。

_2018_10_31_11_38_38

第一步

登陆阿里云官网搜索“应用高可用服务”, 或者直接输入https://www.aliyun.com/product/ahas 打开产品首页,点击“立即开通” 开通公测服务。新用户第一次进入控制台后,可以选择查看demo来了解产品的基本功能,或者进行RAM授权,然后进入到安装探针来自动感知应用架构的流程。

完成授权后,就进入到探针安装流程,选择环境,默认支持阿里云ECS环境,然后界面会列出你在该region下所有的VPC网络的ECS机器,勾选需要探知的ECS并安装AHAS探针,完成安装后AHAS探针就会开始检测识别你的应用环境中各个进程、各容器和所使用的各种云服务。 同时基于网络流量构建出应用进程之间,容器之间以及ECS之间的网络依赖关系。

image

第二步

安装Java agent(可选), 安装Java Agent可以对应用架构中的Java应用进行动态增强,提供接口级别的性能指标和限流降级能力,根据Java应用所在的环境不同,AHAS提供了普通Java应用, docker和docker compose方式下Java应用加载Java agent的方式安装完之后就可以进入"架构感知"查看实时的架构数据。

安装完之后就可以进入"架构感知"查看实时的架构数据,以下是图例。

所有有网络连接的进程和其之间的网络关系拓扑图

1541043029621_aef584b0_921f_4466_a79b_1f3c49753b42

进程的详细信息及其依赖关系

1541043058464_0714a935_cb25_4f29_ace3_c8a6ee56160c

点击跳转到相关联的进程

1541043101731_890cbc00_3ade_423c_8435_aa8152d47ffa

进程所在的Docker容器

1541043116372_c42f80ce_997d_491a_9483_970a8cccd7fb

进入该容器

1541043131440_2df38f6c_c1eb_4104_b507_c2797435f391

Docker容器所在的主机

1541043144522_c21b8fdc_66ba_4057_90c3_508b24475702

点击进入该主机

1541043158097_5c089c7e_3308_44ad_86fe_bd77075cb379

欢迎加入企业级互联网架构交流钉钉群,群号:21704851

相关文章
|
负载均衡 关系型数据库 RDS
良好架构设计中的可靠性:高可用、容错、灾难恢复
良好架构设计支柱 云计算良好架构设计有五大支柱,分别是:安全性,可靠性,性能效率,成本优化和卓越操作。其中可靠性是指系统从基础设施或者服务故障当中实现恢复、以动态方式获取计算资源以满足需求,以及缓解配置错误或者暂时性网络问题等干扰因素的能力。
4962 0
|
4月前
可用性
(1)网络信息可被授权实体访问并按需求使用的特性。 即网络信息服务在需要时,允许授权用户或实体 使用的特性,或者是网络部分受损或需要降级使 用时,仍能为授权用户提供有效服务的特性 (2)可用性是系统在执行任务的任意时刻能正常工作的概率,一般用系统正常使用时间和整个工作时间之比来度量 (3)提高可用性需要强调减少从灾难中恢复的时间 (4)是产品可靠性、维修性和维修保障性的综合反映。
156 62
|
7月前
|
运维 监控 负载均衡
什么是系统可用性?如何提升可用性?
本文探讨了系统可用性的概念、计算方法及其重要性。可用性指系统能在预定时间内正常运行的比例,计算公式为:(运行时间)/(运行时间+停机时间)。文章列举了不同级别的可用性对应的停机时间,并介绍了提升系统可用性的多种策略,包括冗余设计、故障检测与自动恢复、数据备份与恢复、负载均衡、容错设计、定期维护与更新及使用高可用性云服务和网络优化。这些措施有助于构建更加稳定可靠的系统。
930 0
|
缓存 运维 监控
稳定性与高可用保障的工作思路
稳定性与高可用保障的工作思路
165 0
|
SQL 缓存 Cloud Native
如何在大促中做好系统高可用
本文就围绕大促来谈谈,如何在非预期的情况下,始终保持我们的系统工作在最优解?
如何在大促中做好系统高可用
|
SQL 存储 监控
聊聊服务稳定性保障这些事
信海龙(花名沧龙),十余年的互联网开发经验,2013年加入阿里巴巴,深耕于电商、社区相关应用开发与架构。同时也是多个开源项目的开发者和维护者。代表开源作品,tclip,基于人脸识别的图片裁剪扩展。
787 0
聊聊服务稳定性保障这些事
|
存储 Kubernetes Java
K8s集群稳定性提升手段
K8s集群稳定性提升手段
K8s集群稳定性提升手段
|
存储 缓存 监控
3+1保障:高可用系统稳定性是如何炼成的?
影响系统稳定性的架构设计有哪些?一个可持续保障的研发运维流程机制是怎样的?如何培养团队技术人员的意识和能力?本文作者以团队技术负责人的视角,从三大技术要素和一个业务要素,分享在稳定性建设上的实践性思考和简要思路。希望对同学们有所启发。
3+1保障:高可用系统稳定性是如何炼成的?
|
监控
SLA服务可用性4个9是什么意思?怎么达到?
SLA:服务等级协议(简称:SLA,全称:service level agreement)。是在一定开销下为保障服务的性能和可用性,服务提供商与用户间定义的一种双方认可的协定。通常这个开销是驱动提供服务质量的主要因素。
911 0
|
Java Linux 程序员
如何提高阿里云上应用的可用性(二)
这是如何提高阿里云上应用的可用性系列文章的第二篇,第一篇传送门。 在单体应用时代,最大的问题是如何解决数据库瓶颈,而微服务之下,一个大应用被拆分成了几十个甚至上百个微服务,数据访问的压力被传导到了服务之间的网络,服务强弱依赖,服务雪崩等各种问题随之而来,那么如何保障服务的可用性以及整个应用的健壮性.
2283 0