阿里云可观测峰会-行业实践分论坛| 学习笔记(五)

本文涉及的产品
可观测可视化 Grafana 版,10个用户账号 1个月
简介: 快速学习阿里云可观测峰会-行业实践分论坛

开发者学堂课程【阿里云可观测峰会-行业实践分论坛:阿里云可观测峰会-行业实践分论坛】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/776/detail/13940


阿里云可观测峰会-行业实践分论坛


六、阿里云 Sernerless 可观测实践

阿里云智能设计云云生用平台 Sernerless 团队的孔德慧,云原生正在掀起一场新的技术浪潮,Sernerless 和可观测都是当下非常火热的一天,Sernerless架构下用户需要如何排查和定位问题?

作为Sernerless服务的提供商,又需要为用户提供怎样的可观测能力?今天来为大家分享阿里云Sernerless可观测的最佳实践。

本次分享分成三个部分,第一部分,Sernerless简介介绍,什么是Sernerless ,Sernerless下的可观测遇到了什么新的问题,第二部分和第三部分是函数计算,作为阿里云Sernerless服务的提供商,为用户提供了怎样的可观测能力,第二部分介绍函数计算内置的可观测能力,第三部分介绍函数计算对开源和相关可观测能力的探索。

首先来看什么是Sernerless ,Sernerless是云原生技术发展的高级阶段,从物理机到云主机,在dos发展可以用人类的进化来打个比方,从采集野果的原始社会,到刀耕火种的古代社会,再到工业设施完善,信息化高速发展的现代社会,人总要想办法填饱肚子,但随着社会的发展和生产力的进步,人在如何填饱肚子上花的时间越来越少了,更多的时间可以用来实现社会价值和个人理想。不是不吃饭了只是不再需要去亲自摘果子,不需要亲自放羊,甚至不要关心的是果子从哪儿摘的小羊是如何养的,从物理机到Sernerless思维的发展,也是类似的物理机时期开发者需要组装服务器,搭建机房,为了承接业务峰值,需要提前准备平时量几倍的服务器资源。当云主机时期开发者不需要组装机器也可以获取到计算资源了,直接基于主机在进行。为了承接峰值流量,提前规划并且购买云主机或者结束后是释放主机,计算机计算资源的利用率得到了进一步的提升,这些成本也有所下降。到了三个阶段开发者不但不需要组装服务器了,甚至不行到这些购买和释放计算资源了,只需要专心的开发业务逻辑Sernerless云产品来保证业务稳定可靠的运行。开者是对实际使用的计算资源付费,资源成本进一步下降,Sernerless不是没有服务器只是业务开发者不需要关注,服务器仍然是运行在真实存在的服务器之上,计算资源的维护。从用户转交给了云服务,用户只需要聚焦于业务逻辑代码的开发,按实际的使用量付费。回到前面人的净化的比喻,但是刚觉得不是饿的慌,人类的今天依旧要填饱肚子,只不过不需要亲自爬树摘果子,不需要亲自放羊。不需要关心果子是从哪摘,小羊如何养,只需要按照实际的购买量来付费,其余的时间就可以实现不的影响。第二张图进行了很好的概括,从物理机到Sernerless,将开发者从复杂的基础设施维护中解放出来,开发者更不关心底层的基础设施,更关心业务逻辑的实现,资源利用率更高,资源成本更低,人力成本更低。

image.png

接下来介绍Sernerless这种形态,弹性容器,Sernerless隐形se函数计算Sernerless分别是容器级别应用,结合函数级别的抽象,一些属于容器资源带着无需管理底层服务器,只需要提供提前打包好的镜像就可以运行容器了。但是多大的负载需要多少勇气,什么时候扩容,什么时候缩容,流量如何调度,还需要上传来解决。Ask的属于容器编排,帮助开发者进行相应的编排,节点的维护和容量的规划由ask来处理,也就是说S来帮助用户搭建托管的集群,集群还是用户的,开始帮助用户来搭建集群,调度流量。Surface是面向应用的,Surface品牌计算机群不再是用户的,而是归云产品,所有开发者不需要维护管理计算机群,只需要部署应用负载均衡网关,就可以将业务弹性平稳运行起来。X是内项函数的。计算资源关于产品归函数计算所用。不但不要乱进,也不需要搭建互联网,还是在内置互联网核心系统队列,开发者只需要编写业务代码、部署应用,采用计算来保障这个弹性稳定运行,其中函数计算的研发和运维效率最高,抽象程度也最高,用户不需要提前购买和配置任何计算机。一行代码就可以在可以在函数计算上将应用跑起来,在这个过程里,只有代码是用户的,其的全部计算资源都是函数计算

image.png

函数计算是如何实现的,左边这个图是函数计算一个架构图,首先用户需要将的应用,这个或者镜像的格式先给函数计算,来的时候非常同步调用和调用请求会先经过负载均衡网关到达函数计算系统的网关。系统网关获取到资源调度模块获取计算资源,这个资源地址之后找到这个计算资源对应的函数执行引擎,并且在函数执行引擎里面执行用户代码一步调用,也是请求通过负载均衡到达邯郸系统网关。这个时候不一样,请客来了之后,会先将这个事件写入消息。

有一个专门的事件分发模块,不得从这个消息队列里的消息,再去资源调度模块或者计算资源,然后找到这个计算资源进行交互的代码,通过结构图中不发不难发现,函数计算架构具有如下的特征,第一个第二个配合画这些,调度节点和执行环境都是关于产品的要点,就是这个环境,就是用户没有办法感知,这也给用户的排查问题带来一定的困难。第二个实例轻量化,实例求解扩容,这里来着重介绍一下,说起来了之后系统网关和一键分发模块。调度如何计算资源调度模块如果没有资源怎办呀?

就要去创建计算资源,然后再把这个资源地址返回给网站或者是研发模块,可以看出来,实际是以请求级别进行扩容的,实际的生命周期更短,更不可控,什么时候进行是一种事例的,已经知道什么时候进行实际的扩容,什么时候进行事例的扩容?就是当这个实力里面没有请求执行的时候,就会等一段时间把这个事例给回收掉,如果这里面有几个事情这个就会很长,如果这时马上就清楚了,很快就被回收了,实例的生命周期不确定,周期会更远,实际规格小,规格是128兆1/12,这个规格就是三个事件的函数计算。请求要流转多款产品。这上面的特征可以发现,函数计算和之前的传统开发模式有着很大的区别,还算客观测验面临下调。第一个数据收集难,实例生命周期更短,实例规格更复杂,更像传统的附属的观测技术,有办法施展一直收集整理,最小需要是512兆的内存,最大需要设置这个内存,这个在的128兆的还是实力,根本没有办法实施。另外函数的执行其实都共享的就是传统的方式也不太支持众多。另外一个就是说,因为函数的这个生命周期是由系统控制的,用户没有办法知道什么时候开始,什么时候结束。直接导致了很多观测数据没有办法成功不能发送出去,会进行详细的讲解。

第二个问题是数据分析难关的数据量很大,数据量随着用户数的增长呈指数级的增长,这个数据量大的时候,对数据链路的稳定性然后数据查询速度,包括存储的成本,都提供非常大的挑战,这里分析了不少难度。

第三个问题定位难。中国式的组件使得监控数据三维的各处。问题流程繁琐,举一个刚才说是原出发地出发,首先会先通过这个电源,比如说是S或是es,之后,函数就开始执行。到了这个里面就可以先处理这个原消息并将处理结果。用户另外一个数据库里面,比如说是ABS或者这样一个请求,就经历了好几个产品,如果如果发现一个其端也是非常的话,要先去上游看看是不是有问题,再谈计算者是不是调度有问题,是不是得时间太长就这个问题。

第二个问题,就是不可以破坏环境,破坏是因为这个环节的有没有就要求临产检测报告更多的指标,第三个函数调用,资源调度都是以求为主的实力的监控。刚才说的请求宽容都是以请求为例子,并且这种事件出发的这种场景也是需要也是以这个为例来串联上下游的,需要提供更细粒度的这个。

image.png

以上的几个问题,开发者对很高的全面上手更简单的可观测目标,收集了客户需求重新梳理一下三个可观测目标,第一个提供开箱即用的观测平台,统一的观测页面就是用户不需要什么复杂的配置,这个配置上就能用只要有空就可以看到这些调用的指标。还有三个平台,一般需要如期的进行用什么配置,然后这个平台端也不要侵入用户的APP,使用平台来进行采集就好了。就平台和用户各司其职,来完成一个完整的可观测。第二个要求平台,因为平台端要求平台提供丰富的日志、丰富的指标、完备的日志,详细的表面就是提供尽可能多的指标来让用户充分了解这个执行环境。第三个是就是更细腻度的。可能就要提供其为对这个观测。实现全链路的说这个引入一些新的问题。但是这也肯定不是完全摒弃之前的这个开发者的开发习惯,要让开发者更快更顺手的用起来,也要兼容传统开发者开发习惯,就需要兼容开发者以实力问题的关键。这本来就是不对外暴露实际的概念,但是为了让用户对整个房地产的计算法就更有信心?然后也希望也也是为了用户排查问题方便就暴露了的监控第三个数据开放协议,开源观测数据已经投递给用户了,允许用户进行自己的处理,些数据发给用户。然后另外一些有标准规范的,这些数据都使用了开源的规范,就就也希望使用开源规范,然后来方便用户同意这些数据基础。准备下来,这三点开箱即用,兼容提点,开源开放。

image.png

接下来就介绍算是如何用户提供观测能力的。进入第二部分,函数计算内置可观测能力成立。首先来看计算能力图,这张图就是今天的所有的可观测能力了,先来简单的看一下,首先这四个大的部分指标与质量链回填,指标是ATI监控集成?会在函数的这个监控中心上提供监控指标,为了兼容S用户广泛的用户的这个体验,也提供SF的解决方案,因为至少适合日志图无缝集成提供的函数日志,请求日志,日志特别是生活在界面上,也是和链路这种产品进行的。就是排除计算会默认上报系统内部关键的时间,这些都是基于这些协议的,并且在这个店面的上下文信息给用户,用户可以在函数里面基于严格,或者的转型。ATM上也是和阿里的产品集成用户。就可以查看一些的指标,比如说简单的数据,然后连接情况这些,然后同时因为有一些客户也更喜欢使用三方的这个观测产品。也提供了一些提成方案,下面会讲到如何提供的这个解决方案。

image.png

现在就开始详细的介绍,是如何被用户呈现的可观测能力,分层次的部分,数据的采集,数据存储。前面介绍的业务代码是在函数计算的,执行引擎就会根据用户设置的函数内创建不同规则的函数,使用用户的函数间不同的函数是一种。这个执行引擎实际上是够的,底层支持DTS和16的基础知识的函数实例分别是这种安全容器。在执行引擎的内部,实现了一整的负责函数、实例生命周期的管理,函数实例健康状态监测和观测数据的收集、处理和上报。数据处理就有三个特点切入。占用函数实例的附带。用户不需要关心是如何处理的,这个也不占用资源,对用户无感知服务实例没有入侵。第二个是支持异构的执行环境,在不同类型的执行引擎中,日志指标教练的处理有一定的区别,也对这些区别分别是配了一些S,这些环境中的日志指标,教练的采集和处和使用金属。然后以CS环境,其实不存在多余的问题,本身是靠在一起的职业环境当中,用户是靠外来进行隔离的。一个在里面只会有一个用户,但是接触这个环境里面再一个执行环境。同一个IP的需要支持不同用户实例的预置指标的收集。

第二个数据存储,数据存储其实有两种。说当数据量上来的时候,这个电路的会越来越高,同时因为函数自己来存储这些数据,就没办法获得,比如说这个数据只是一个封闭的,没有看到的用户也是不好的。所以,选择把数据存到用户的产品,也就是收集好了。支持服务,提供这种服务。用户就可以对这些数据进行二次的。已经存到用户的产品。怎把它拿出来看。就需要提供一个就是处理数据,就是前端需要查看这些数据的时候,就有一个设计架构的范围,从用户的产品里面抹去原始数据,这个原始数据进行处理聚合,格式转化,传给前面的这个控制台。是计算架构实现的?在上面创建了三个函数,分别对指标、预知和教练进行处理拿数据的展示经过层层的处理,终于可以给用户提供一个开箱即用的完整的、统一的都能看到哪些信息,罗列指标上是非常丰富的,有多层次,然后多维度,有集群服务,函数的指标,求实际的指标,还有质量指标,然后日志,就是函数级别的认识,实例级别日期就只好实施,就是可以实时的查看财务人事,还有就是也可以根据来对人进行搜索,还经常会自动上报系统内部的教练,比如说机动时间,调度时间这些,同时也可以串联上下游,一个是串联上游,是还算可以识别这个开源的,这样练的high的,如果用户把上游的hi传进来的,还是就可以基于用户的。创建了一个串联下游,还是会把这样的上下文给用户,用户也可以就是创建一些自定义的资料。比如说去创建数据库的奖励或者是写本地数据的亮点。

image.png

接下来对观测的数据采集和Sernerless的数据处理详细的介绍。首先来看观测数据采集,之前说到每个执行引擎里面会有一个manage,来负责实习生周期的管理,然后观测数据的采集和上报是如何实现的呢?看其实每个。本次的manage来负责管理函数实例。创建新的函数实例的时候只会记录一份函数实例的元素,并分别启动指标采集、病史采集和调研采集的携程,每个函数实例都有自己的携程,这个函数实例的采集互不影响,在实际销毁的时候观测携程也会随之关闭。整个设计使得数据采集具有如下的特点,因为它们之间是互不影响的,每个函数实例的数据指标采集是不影响的也支持异构的执行,环境数据的采集随着生命周期起用的采集的都是信息,这些指标是啥指标指的是日志,指标才行,其实主要是请求级别的指标和世界级别的指标。因为要为用户提供就是请求力度的监控请求力度。请求的监控就是,这个请求的函数都经历了啥,在执行的时候执行时间有多久,但占内存是多大有没有,如果出错了,错误类型是什么呢,第二个类型是同步调用,还是异步调用?类型是按量实例,是预留实例这些级别的指标,实例级别的指标就是也会在这个函数执行的时间段内采集十级别的指标,包括这个实际的cpu,内存,网络流量,还有里面的请求就是一个请求数。在采集上是能收集函数输出到标准输出的认知,比如说日志,包括函数日志,实例日志,然后就是基于IP协议自动上报系统,这里是如何来实现这个数据采集端的,和采集的内容进行简单的介绍。

image.png

下面介绍Sernerless的数据处理架构,用户要看的是一个完整的报表,都不想查看数据了,前段收到了用户查看数据的行动,从哪儿来。需要有一个YP来对前端反馈数据,这个YYP承担的工作就是一个是从用户的产品里面获取原始数据,另外一个就是在这个业务逻辑里去处理这些数据,然后把它和前端约定格式反馈给前端。是将这个逻辑处理逻辑知道了函数计算上,也充分的享受了这个架构的,然后这个架构是毫秒级的,可以轻松应对突发流量,因为这种控制的肯定有很多使用业务就会非常大。同时对开发者,也确实是需要关注的业务逻辑需要关注你曾有多少台资源,也不需要去维护服务器。就是让的这个开发运维效率更高了。这个是Sernerless的优点,所以也充分地享用了策略的红利,为了保障这个服务的可用性和可靠性,也在国内外进行多个区域的部署来尽可能的。能避免互联网络的访问的问题。

image.png

经过前面的层层处理终于可以为用户提供一个比较好的观测体验,主要包括以下三个部分,第一个是提供开箱即用的同一个观测平台,公司的指标,这里提供非常丰富的函数级别,服务级别及函数级别,还有请求级别、实力级别的指标,然后这个指标的聚合力度有两级。就是尽可能的把函数个指标都暴露给客户,让客户更信任执行环境也提供了这个请求力度的监控。可以看到有请求的这样结果,然后这个请求的这些时间内存使用量,然后点开这个请求日志,可以看的日志点开,这样可以看到这个请求可以看到请求的调用链,请求的调用链可以看到请求在系统,函数在系统上报的亮点就是调度的时间,而且总调度资源的时间,还是在系统启动的时间,包括下载代码在自定义镜像的时间,代码这个培训时间这些都是系统自动上报的,就是用户不需要进行任何整个安装不需要进行什么配合就可以使用这样一个开箱即用同一观测平台。

image.png

第二个也是要兼容,也是刚才说的金融传统开发者开发习惯?提供了实例级别的监控,包括实例级别的指标,可以看实例指标数,cpu内存,还有网络流量,还有一个实例请求数。可以看一个函数维度的聚合,就这个函数的计划的一个大概,然后下面可以看一共有多少个实例,然后每个实例的指标是怎样的,好提供了实例级别的日志,甚至还可以登录到这个实例里面去,这样用户对自己的经济环境下的有信心了。

第三个,数据开放协议开源。数据开放是把所有的产品都存入到了用户的产品里面了,就把这开放,协议开源线路追踪,遵循开源open协议,可以串联上游,连接下游,串联上游是识别上游开源的这个协议,点击下游是将上下文传入用户状态,用户可以基于当前的链接或者进行的一个卖点。这里有一个简单的事例,就是一个MS的实例,上游用户是记录了passage所在MSD里面等待的时间达到了函数计算之后,函数自动记录了和调度时间然后在函数计算的一个系列里面的堆积的时间,还有机动的时间把这个给下游,然后再用ATP里面location。用户又自己买了这个自定义的调用链,就可以看到一个完整的端到端的表面,用户在说有一个请求调用端时间很长的话,通过调用链的这个时间究竟花在哪里,就可以进行更有针对性的排查和定位。

image.png

接下来,根据两个Demo展示一下的观测能力,第一个是函数计算错误问题的定位,

image.png

这个看这个函数有41个错误,然后点进去看看到底是为啥出错。先是看服务级别的错误,然后就可以看函数级别的错误,然后就可以定位到出错的请求,看这些都是放Demo带入,就是已经出现点进来看请求日志。原来是处理了一个不存在的这样就可以去OS为什么要存在了,就是一下子从指标然后下到请求,然后再查看的日志可以快速的定位问题。

第二个是能耗分析,有个请求发现之前特别长,但是实际的业务逻辑又没有很复杂,就是百毫秒级别就结束,但这个请求端去执行的企业要看一下是咋回事,请求,调用链就看第二页发现这个函数的执行时间确实只有170毫米,但是遇到冷启动,冷启动里面下载代码花费了2S-3S,然后还说实际启动花了四秒,这样子就冷启动就花了七秒的时间,为了解决这个问题,要看能不能缩减一下代码包的大小,让下载代码的时间变少,然后另外也是要优化启动时候的逻辑,让函数启动的时间也变短一点,如果就是对启动时间特别敏感就可以使用的流驶来完成规定启动,用户可以去激发实践去进行自定义配置

image.png

进行的最后一个部分函数计算对开源第三方观测能力的探索。

很多客户喜欢FC或者是开源的SaaS厂商的监控能力,比如但是现在还算当中非常难用起来可观测数据大概率会发送失败,这是怎回事,大多数的观测服务商可以就是后台只采集数据的质量,但是FC实力在请求执行完成之后会引起冻结时间,下次来的时候才解冻,如果发送时间刚好处于事例冻结时期这个数据就会发送失败了,FCS就代表这里主要是函数的执行引擎,首先实例启动之后会先调用SQL接口用户。

用户可以在数据库,数据化学配置,启动,负责采集,数理化结束之后,会执行,执行结束后系统会立即free这个函数冻结,如果这个时候到了后台的会发数据要发送失败,后面有新的出来,如果后台的观测数据发送时间正好落在实例的活跃的时间内,就可以发送成功,所以看在不做任何处理的情况。

可以发送成功,运气不好就会发送失败。这个函数实例的生命周期是还算系统控制的,用户也不可见因此。用户无法预知这些观测数据啥时候可以成功啥时候会发送失败,这就导致了数据的缺失和可观测功能不稳定。为了解决这个问题函数计算扩展的编程模型允许用户监听生命实力周期间这个实例的生命周期,因为可以自己实现pre和pre ,stop函数逻辑。有时在freeze之前会告诉用户执行的Praise的代码,可以在friends里面flash的这个观测数据,然后再回收销毁这个函数实例之前,都会用的stop函数,用户可以在里面关闭连接,数据的采集,基于这个技术可观测数据就可以稳定的发送了。

image.png

也是使用了上面的这个技术,内部可以和MDM进行集成,然后也提供了集成三方下厂商如new relic的解决方案。下面这个图列出了MC目前已经提成或者已经提供解决方案的产品和技术,也将在这个方向进行持续的探索。

以上就是今天关于可观测分享的全部内容了。

七、阿里云可观测峰会

是阿里云智能设计部设计中心的小区,很高兴有这么多的朋友关注技术的使用体验,也很荣幸能够在一场技术公会中和大家浅聊一下客观整体设计。可观测的概念起源于几十年的控制理论,随着各种系统越来越复杂,观测性和相应体验越来越受到重视。

image.png

一个典型的例子是汽车行业的发展,动力系统、能源和驾驶方式都在发生变化,驾驶员有感知的掌控的也随之变化,因此汽车人机界面体验。

image.png

在it领域。在这样一个云原生的时代,系统架构更加复杂,研发团队融入了可观测性的一面,开发者写出的应用都是可观测的,监控、日志、记录、追踪、自动拍照、预测等等,如何设计好的可观做体验?好像还没有设计师探索过,在这里抛砖引玉,希望能够帮助大家构建直观高效的观测体验,更充分的利用技术优势,也希望未来有更多的行业专家,一起探索可观测特点。首先基于阿里云产品设计实践,总结出四个观测体验设计原则,接下来一起看

image.png

第一个原则提供当前所需的最小必要信息,就是克制避免信息轰炸,不要因为技术能够获取到用户展示的数据,要帮助用户对信息进行分层、聚类,排序,让用户快速锁定一个洞察,然后逐层深入。

image.png

第二个原则,运用色彩强化业务与异常。色彩运用在可观测体验当中非常重要。色彩不仅仅是为了让它变好看,而是应该用来诠释业务状态,强化异常感知。如同一个数据系列不应该是五彩斑斓的,但异常状态是应该用红色强调出来

image.png

第三个原则对话式的探索,理解的好的可观测体验中,用户是能够和系统对换一步一步挖掘跟阴道解决问题。比如说有个红色L标签,看这里是一个异常,但旁边的主行动点就是得尝试,建议去查看一下,此时点击按钮,就好像回复好取日志,接下来调整的日志,发现一段高亮其实也是在想新的助理说助理们这个日志其实这里面包含的要素非常多,需要设计一个合理的路径,并且引导用户及时提供洞察、建议、反馈等等。

image.png

最后,也是第四个原则确保一致体验。一致性是管控体验设计中最重要的原则之一。对于用户而言,便宜,这可以降低学习成本,降低操作时长和错误率,提升难度。对于产品的设计和开发者而言,体验一致可以提供一个稳定性的保障

image.png

来看一个案例,这是阿里云应用实时监控服务APP的transformer,存储了全量的应用调度明细数据。但是用户并不需要直接看到这些最底层的统计数据。如何关心的是应用是否健康,以及问题出在哪里,所以推出的第一个是图的最小必要信息,是高位统计图表,尤其是异常相关的。然后排序列表以及筛选器用颜色来表示正常或异常,在筛选器和筛选的结果当中是保持一致的样式。下面看一个排查问题的场景,假设今天接到告警,说有些口号是很慢,但想知道有哪些接口,以及为什么慢。检查一下接口分布。最近一个小时按接口来聚合和现在图中不同的颜色代表不同的接口,重点看标号是大于三秒钟。集中在两个接口上。其实还是很直观的,接下来排查一下为什么会慢,来看一个具体的定义。第一条比较简单,点击可以看到更多的详情信息,指标日志等等,无论是从外面进入详情还是在里面查看调用链的详情,都是点击从右侧退出,再查看详情上保持一致交互操作流畅,就不需要思考这个排查,找到最慢的一条查看现场能够为行代码。这个词语的方法就是结构慢的定义

image.png

接下来,开发需要去这个题目中解决标志的异常模型。可以看到整个排查过程的体验是比较顺畅的,因为信息的分层合理方面聚焦,探索路径和引导方式也符合认知清晰操作。这个案例只是可观测体验的冰山一角,结合数据采集、管理、观测、处理全生命周期来整理和观测体验相关的重点业务场景,发现有好多流量用的接入,数据迁移传输,备份链路追踪攻击,素颜架构感知、故障演练都不容再等等,非常非常多。于是构建了一套体系化的可观测体验设计能力来支撑。这些设计能力包含数据、色板、基础图表,基础规则和场景化的体验,但是封装为安全规范组件以及颁发的阿里云主题和插件。

其实的目标有点远大,希望能够提供覆盖全流程的最佳体验设计实践,帮助开发者全面提升业务可观测体验。这套设计能力加工程化的能力构成了阿里云可观测体验设计体系,目前还正在

建设中

image.png

这条可观测体验设计体系是从近百款阿里云产品的手段特点设计当中。和其市面上的不同的是都具有强业务属性,比如在数据色彩方面,提供基础色、顺序色、发散色、渐变色,适合图表大盘,编排为三排到三维脱骨等等,显示这种复杂数据系列的配色方案,同时优化了色彩变化的知名度,也让观感更好,在基础图表和规则方面比普通的图表更加细致,除了图表构成规范通用的交互规范,还有物质为本区监狱推行时间轴联动教。根据图表、场景和数据的应用一细化的规则。的精华在于业务体验,办事能用指标图表、系统指标、图表、可视化的前置检测、数据传输、任务管理、二维三维架构图、超级轨迹保护策略编排等等,都是经过打磨这个验证的方案。

image.png

以应用黄金三指标亮图表为例,首先看到,但是有详细的构成说明,请求数、错误数、延时、交互式得到数据、联通规则等等,三个图表都可以方便的切换统计方式,对于岩石可以根据排查需要切换绝对值或者是分布比例。分布图中会显示关键的参考性、九五数据、九数据等等,还可以放大来查看更详细的数据,对比历史数据等等。所以appearance的体验办事具有强业务属性,直接使用就能获得比较好的观测体验。

image.png

再来看另外一种类型的体验,但是因为云原生的架构、资产分布和内部资源、销售情况等,天然就是当然三维结构所以呢,体验凡是涵盖很多管控收尾的设计,还原真实的价格,高度可视化,信息更加全面,洞察也更加。更加直观,比如容器监控提供业务资源层全链路的可视化监控,只是从二维硬部下端排查到资源的问题,展开3D全景全景拍照。这时源泉中心原资产全景图帮助用户感知网络安全风险和安全问题,下次能够查看资产防护关节风险溯源,直观定位风险来源和影响,能为用户提供针对性的智能防护建议。其实能够看出available这个设计体系不仅仅是面向设计师的强业务属性,希望能够帮助开发运维安全运营的角色,发现问题,同时还能够及时的解决问题,预防问题的发生,提升desktop的体验。这也是探索可观测体验设计的意义。

以上就是本次关于可观测体验设计的一些探讨,目前正在建设中,还有很多细节需要打磨的场景要丰富,是从业务中来到业务中去验证,预计今年。会正式发布阿里云可观测体验设计指南。

相关实践学习
基于函数计算一键部署掌上游戏机
本场景介绍如何使用阿里云计算服务命令快速搭建一个掌上游戏机。
建立 Serverless 思维
本课程包括: Serverless 应用引擎的概念, 为开发者带来的实际价值, 以及让您了解常见的 Serverless 架构模式
相关文章
|
18天前
|
存储 SQL BI
毫秒级查询性能优化实践!基于阿里云数据库 SelectDB 版内核:Apache Doris 在极越汽车数字化运营和营销方向的解决方案
毫秒级查询性能优化实践!基于阿里云数据库 SelectDB 版内核:Apache Doris 在极越汽车数字化运营和营销方向的解决方案
毫秒级查询性能优化实践!基于阿里云数据库 SelectDB 版内核:Apache Doris 在极越汽车数字化运营和营销方向的解决方案
|
21天前
|
算法 物联网 数据库
阿里云 OpenSearch RAG 应用实践
本文介绍了阿里云OpenSearch在过去一年中在RAG方面的应用和探索。
476 2
阿里云 OpenSearch RAG 应用实践
|
11天前
|
弹性计算 Prometheus 监控
阿里云可观测 2024 年 5 月产品动态
阿里云可观测 2024 年 5 月产品动态。
|
27天前
|
弹性计算 监控 开发工具
【阿里云弹性计算】阿里云ECS的网络优化实践:VPC配置与网络性能提升
【5月更文挑战第29天】阿里云ECS通过虚拟私有云(VPC)提供高性能、安全的网络环境。VPC允许用户自定义IP地址、路由规则和安全组。配置包括:创建VPC和交换机,设定安全组,然后创建ECS实例并绑定。优化网络性能涉及规划网络拓扑、优化路由、启用网络加速功能(如ENI和EIP)及监控网络性能。示例代码展示了使用Python SDK创建VPC和交换机的过程。
276 3
|
3天前
|
存储 弹性计算 安全
构建高效企业应用架构:阿里云产品组合实践深度解析
该方案展现了阿里云产品组合的强大能力和灵活性,不仅满足了当前业务需求,也为未来的扩展打下了坚实的基础。希望本文的分享能为读者在设计自己的IT解决方案时提供一定的参考和启发。
36 1
|
7天前
|
负载均衡 测试技术 网络安全
阿里云服务网格ASM多集群实践(一)多集群管理概述
服务网格多集群管理网络打通和部署模式的多种最佳实践
|
17天前
|
运维 监控 搜索推荐
客户案例 | 阿里云向量检索 Milvus 版在识货电商检索场景的应用与实践
本文分享了阿里云向量检索 Milvus 版在识货电商检索场景的应用与实践。阿里云的 Milvus 服务以其性能稳定和功能多样化的向量检索能力,为识货团队在电商领域的向量检索场景中搭建业务系统提供了强有力的支持。
|
27天前
|
运维 监控 安全
【阿里云云原生专栏】云原生时代的 DevSecOps:阿里云的安全开发流程实践
【5月更文挑战第28天】在云原生时代,面对安全新挑战,阿里云践行DevSecOps理念,将安全贯穿于开发运维全过程。通过安全需求分析、设计、代码审查、测试及持续监控,确保云原生应用安全。例如,Kubernetes配置中加入安全设置。阿里云还提供多种安全服务和工具,如身份认证、云防火墙等,助力用户构建安全可靠的云应用,为数字化转型保驾护航。
126 4
|
11天前
|
人工智能 监控 Cloud Native
多款可观测产品全面升级丨阿里云云原生 5 月产品月报
多款可观测产品全面升级丨阿里云云原生 5 月产品月报。
|
29天前
|
弹性计算 运维 监控
【阿里云弹性计算】云上自动化运维实践:基于阿里云ECS的自动化部署与管理
【5月更文挑战第27天】阿里云ECS自动化运维实践:借助ECS API和SDK实现自动化部署,通过Python示例展示实例创建。利用Ansible、Docker等工具进行配置管理和容器化,结合CloudMonitor和Auto Scaling实现监控告警及资源动态调整,提升运维效率和系统稳定性。
118 0