官方博客-第32页-阿里云开发者社区

  • 2024-05-15
    102326

    大语言模型推理提速,TensorRT-LLM 高性能推理实践

    大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

    102,326
  • 2024-05-15
    93331

    当 OpenTelemetry 遇上阿里云 Prometheus

    本文以构建系统可观测为切入点,对比 OpenTelemetry 与 Prometheus 的相同与差异,重点介绍如何将应用的 OpenTelemetry 指标接入 Prometheus 及背后原理以及介绍阿里云可观测监控 Prometheus 版拥抱 OpenTelemetry及相关落地实践案例。

  • 2024-05-15
    105466

    SLS 大模型可观测&安全推理审计标准解决方案

    本文介绍大模型可观测&安全推理审计解决方案和Demo演示,SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能,自定义仪表盘;SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据,建设完整统一的大模型可观测方案,为用户的大模型安全推理审计提供全面合规支持。

    105,466
  • 2024-05-15
    579

    Nacos 在云原生架构下的演进

    Nacos 在云原生架构下的演进

    579
  • 2024-05-15
    1497

    从方法论到最佳实践,深度解析企业云原生 DevSecOps 体系构建

    本文主要介绍了云原生安全的现状以及企业应用在云原生化转型中面临的主要安全挑战以及相对成熟的一部分安全体系方法论,深度解析企业云原生 DevSecOps 体系构建。

    1,497
  • 2024-05-15
    680

    解密最受欢迎的开源 Serverless 框架:流量篇

    解密最受欢迎的开源 Serverless 框架:流量篇

    680
  • 2024-05-15
    112865

    线程操纵术之更优雅的并行策略

    本文详细介绍了并行编程以及一些并行问题案例中的真实业务场景。

    112,865
  • 2024-02-18
    134735

    Higress × OpenKruiseGame 游戏网关最佳实践

    本文将演示 Higress 如何无缝对接 OKG 游戏服,并为其带来的优秀特性。

    134,735
  • 2023-12-01
    1464

    Koordinator 助力云原生应用性能提升,小红书混部技术实践

    本文基于 2023 云栖大会上关于 Koordinator 分享的实录,介绍小红书通过规模化落地混部技术来大幅提升集群资源效能,降低业务资源成本。

    1,464
  • 1
    ...
    30
    31
    32
    33
    34
    到第
    32/34