《阿里云可观测最佳实践》——4.羽如贸易(下)

本文涉及的产品
可观测可视化 Grafana 版,10个用户账号 1个月
云拨测,每月3000次拨测额度
简介: 《阿里云可观测最佳实践》——4.羽如贸易(下)

《阿里云可观测最佳实践》——4.羽如贸易(上): https://developer.aliyun.com/article/1227070


3 解决方案 & 业务价值


羽如贸易需要一个完整的可观测解决方案,大部分开源工具仅能满足单一场景或技术的监测需求,不满足羽如对于生产环境全方位监测的要求。

image.png


l 从前端客户体验到后端组件的全链路监测

目前羽如贸易通过应用实时监控服务ARMS对以消息队列MQ为代表的中间件服务、数据库服务、微服务架构Java应用、Web应用前端静态页面、node.js项目进行持续监控,实现从前端客户体验到后端组件的全链路监测。这不止是一系列数据可视化大盘,应用实时监控服务ARMS还提供了符合DevOps流程与开发习惯的数据归类及调研分析方式,为羽如贸易解决了相当多的紧急产线问题,有效提升了羽如贸易产研团队故障应急效率,增强性能优化的能力。


l 开箱即用的可观测能力,无需研发投入

作为在一个电商行业高速发展的初创企业,羽如贸易希望将更多的研发精力放在支撑业务高速发展上,而不是疲于应对基础技术问题解决与瓶颈优化上。


l 聚合常见场景解决方案,输出问题诊断报告

应用实时监控服务ARMS提供丰富的默认数据采集指标以及对应的管理能力同时,聚合常见场景问题的解决经验与方案,输出符合开发调研习惯的问题诊断报告(如流量不均时是否存在单机故障),做到智能化应对故障。在业务高速发展的过程中,产研团队可能没有过多精力投入故障复盘、问题总结等事宜。应用实时监控服务ARMS帮助产研团队快速梳理常见问题,为企业带来可观的产线稳定维持能力。


凭借应用实时监控服务ARMS的代码级诊断能力,快速发现业务异常与性能瓶颈。对于业务迅速发展的企业而言,这样的能力至关重要。及时发现、及时改善,使得研发运维团队可以更加从容的面对更多业务以及更多规模的业务流量。


结合阿里巴巴集团自身的最佳实践以及服务海量用户的服务经验,应用实时监控服务ARMS将相关监控及诊断能力一一产品化,以最低的使用门槛,为中小型企业带来带来可观的产线稳维能力,快速解决问题,能快速定位核心原因。同时,面对重业务轻技术基础的野蛮生长型企业,使研发运维团队不必花费人力物力去探索、归纳总结常见问题解决方案,更加轻松、迅速的解决相关技术问题,让可观测能力唾手可得。


依托于阿里云的平台能力,羽如获得强大的技术支持力和资源控制力,做到新技术、新能力拆箱即用,全盘自动化的辅助效果。相应的企业运维场景发生质的转变,从“经验依赖”转为“数据决策”,从“人力参与”到“自动化流程”,从“平台创新”到“应用创新”等。而可观测能力的强化,使得羽如能够更加迅速地根据结果制定相关业务战略与技术调整,实时调整规避风险,更加从容的面对业务与技术调整,打造下一个跨境电商独角兽。

相关文章
|
3月前
|
监控 Java 测试技术
阿里云推出 3.x Java 探针,解锁应用观测与治理的全新姿势
阿里云推出 3.x Java 探针,解锁应用观测与治理的全新姿势
174260 5
|
1月前
|
消息中间件 NoSQL Kafka
云原生最佳实践系列 5:基于函数计算 FC 实现阿里云 Kafka 消息内容控制 MongoDB DML 操作
该方案描述了一个大数据ETL流程,其中阿里云Kafka消息根据内容触发函数计算(FC)函数,执行针对MongoDB的增、删、改操作。
|
2月前
|
SQL 监控 测试技术
阿里云可观测 2024 年 2 月产品动态
阿里云可观测 2024 年 2 月产品动态
|
2月前
|
自然语言处理 算法 关系型数据库
阿里云PAI大模型RAG对话系统最佳实践
本文为大模型RAG对话系统最佳实践,旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术,从而显著提升对话系统的性能,使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践,您可以掌握构建一个大模型RAG对话系统的完整开发链路。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|
4月前
|
存储 机器学习/深度学习 人工智能
基于Megatron-Core的稀疏大模型训练工具:阿里云MoE大模型最佳实践
随着大模型技术的不断发展,模型结构和参数量级快速演化。大模型技术的应用层出不穷。大模型展现惊人效果,但训练和推理成本高,一直是巨大挑战。模型稀疏化能降低计算和存储消耗。近期以Mixtral为代表的MoE(多专家混合)大模型证明了稀疏MoE技术能大幅降低计算量、提升推理速度,模型效果甚至超过同规模稠密模型。阿里云PAI和NVIDIA团队深入合作,基于Megatron-Core MoE框架,解决了MoE大模型训练落地时会遇到的可拓展性、易用性、功能性以及收敛精度等核心问题,在下游任务上取得了很好的模型效果。
|
4月前
|
人工智能 Prometheus 算法
阿里云可观测 2023 年 12 月产品动态
阿里云可观测 2023 年 12 月产品动态
|
4月前
|
人工智能 监控 算法
阿里云向量检索服务最佳实践测评
随着大数据和人工智能的快速发展,向量检索技术在各个领域的应用越来越广泛。阿里云作为国内领先的云计算服务提供商,也推出了自己的向量检索服务。本文将对阿里云的向量检索服务进行最佳实践测评,探讨其在语义检索、知识库搭建、AI多模态搜索等方面的应用,并与其它向量检索工具进行比较。
1214 4
|
4月前
|
机器学习/深度学习 人工智能 物联网
快速玩转 Mixtral 8x7B MOE大模型,阿里云机器学习 PAI 推出最佳实践
本文介绍如何在PAI平台针对Mixtral 8x7B大模型的微调和推理服务的最佳实践,助力AI开发者快速开箱。以下我们将分别展示具体使用步骤。
|
5天前
|
存储 弹性计算 固态存储
阿里云服务器CPU内存配置详细指南,如何选择合适云服务器配置?
阿里云服务器配置选择涉及CPU、内存、公网带宽和磁盘。个人开发者或中小企业推荐使用轻量应用服务器或ECS经济型e实例,如2核2G3M配置,适合低流量网站。企业用户则应选择企业级独享型ECS,如通用算力型u1、计算型c7或通用型g7,至少2核4G配置,公网带宽建议5M,系统盘可选SSD或ESSD云盘。选择时考虑实际应用需求和性能稳定性。