官方博客-第59页-阿里云开发者社区

  • 2024-05-15
    639

    线上故障突突突?如何紧急诊断、排查与恢复

    本文简单介绍了阿里云上关于故障恢复、诊断的一些最佳实践。

    639
  • 2024-05-15
    987

    链路追踪(Tracing)其实很简单——链路功能进阶指南

    经过前面两章的学习,小玉已经熟练掌握分布式链路追踪的基础用法,比如回溯链路请求轨迹,定位耗时瓶颈点;配置核心接口黄金三指标告警,第一时间发现流量异常;大促前梳理应用上下游关键依赖,联系相关方协同备战等等。随...

    987
  • 2024-05-15
    630

    统一观测丨使用 Prometheus 监控云原生网关,我们该关注哪些指标?

    MSE 云原生网关默认提供了丰富的 Metrics 指标大盘,配合阿里云 Prometheus 监控提供开箱即用的完整可观测性能力,能够帮助用户快捷、高效的搭建自身的微服务网关与对应的可观测体系。

    630
  • AI大模型运维开发探索第五篇:GitOps 智能体

    本文探讨了 Manus 智能体的设计及其与传统智能体的差异,重点分析了 CodeAct 机制对智能体执行效率的提升。作者通过《基于LLM的数据仓库》实验反思了交互接口选择的重要性,并提出操作系统和文件系统作为良好的自反馈交互系统。文章进一步结合 GitOps 和持续集成(CICD)理念,设计了一种低成本、可观测性强的智能体运行方案,包括计划智能体(Planner)和执行智能体(Executor)的协作流程。通过实际案例对比,展示了 GitOps 智能体与 Manus 的相似效果,并总结了其在记忆增强、推理可观测性、低成本部署及跨环境适配等方面的优势。最后提供了相关代码路径和参考材料。

  • LoongCollector:构建智能时代的数据采集新范式

    本文聚焦 LoongSuite 生态核心组件 LoongCollector,深度解析 LoongCollector 在智算服务中的技术突破,涵盖多租户观测隔离、GPU 集群性能追踪及事件驱动型数据管道设计,通过零侵入采集、智能预处理与自适应扩缩容机制,构建面向云原生 AI 场景的全栈可观测性基础设施,重新定义高并发、强异构环境下的可观测性能力边界。

  • 2024-05-15
    437

    Serverless与IoT实践:为智能音箱赋能

    本文通过与IoT能力进行结合,让Serverless架构在智能音箱中,发挥有趣的作用。

  • 2024-05-15
    402

    基于函数计算搭建的异步任务执行框架

    本文介绍基于函数计算实现的异步任务执行框架(编程语言:Python3),把跟阿里云资源开通相关的API封装到一个独立的模块,提供标准的API跟企业内部在用的ITSM或OA进行集成,降低客户对接API门槛,更快上阿里云。

    402
  • 2024-05-15
    309

    基于EventBridge HTTP Source构建SaaS应用集成的最佳实践

    本文将介绍基于EventBridge HTTP Source构建SaaS应用集成的最佳实践。

    309
  • 2024-05-15
    325

    从负载均衡到路由,微服务应用现场一键到位

    本文基于常见的服务调用场景,以Ribbon负载均衡组件为例,展示了微服务洞察能力能够在关键的位置为我们还原与记录丰富的现场信息,使得原有的黑盒场景能够便捷直观地被观测到。在微服务架构下,类似的不便观测的重要场景还有非常多,都可以借助微服务洞察能力来监测或是在异常时辅助排查。同时,全链路灰度是微服务治理中比较重要的一个场景,我们在落地全链路灰度的过程中最让人头大的两个问题就是流量路由不生效以及流量逃逸,我们借助于微服务洞察能力可以快速定位与解决全链路灰度相关的问题。

    325
  • 1
    ...
    57
    58
    59
    60
    61
    到第