官方博客-第51页-阿里云开发者社区

  • 2024-05-15
    1120

    vLLM部署Yuan2.0:高吞吐、更便捷

    vLLM是UC Berkeley开源的大语言模型高速推理框架,其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等,一方面可以提升Yuan2.0模型推理部署时的内存使用效率,另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

    1,120
  • 2024-05-15
    44083

    得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

    在本文中,作者探讨了ZooKeeper(ZK)的一个内存占用问题,特别是当有大量的Watcher和ZNode时,导致的内存消耗。

  • 376

    从故障演练到运维工具产品力评测的探索 | 龙蜥技术

    随着AI和云原生技术的发展,业界运维工具百花齐放,该如何让优秀的工具脱颖而出?

  • 1146

    数据库索引回表困难,揭秘PolarDB存储引擎优化技术

    PolarDB分布式版存储引擎采用CSM方案均衡资源开销与可用性。

  • 2024-06-13
    56100

    基于云效 AppStack,5 分钟搞定一个 AI 应用的开发和部署

    区别于传统的流水线工具,本实验将带你体验云效应用交付平台 AppStack,从应用视角,完成一个 AI 聊天应用的高效交付。

  • 333

    Redis Proxy RT上升后连接倾斜

    本文细致地描述了关于Redis Proxy RT上升后连接倾斜问题的排查过程和根本原因,最后给出了优化方案。

  • 2024-08-23
    416

    灵魂拷问-前端的作用--chrome插件篇

    本文会从浏览器插件应用场景切入,穿插插件基础能力和常见入口的介绍,核心回答如下三个问题:插件可以被使用在哪些场景?不同的使用场景我们的主要代码实现思路是怎样的?我们可以从哪些角度入手自己开发一款可以落地实用的浏览器插件?

    416
  • 2024-09-02
    458

    基于 RocketMQ 的云原生 MQTT 消息引擎设计

    本文将介绍阿里云如何将 Serverless 架构应用于消息队列,有效降低运营成本,同时利用云原生环境的特性,为 IoT 设备提供快速响应和灵活伸缩的通讯能力。

  • 2024-09-03
    653

    OpenTelemetry Golang Agent 0.1.0-RC 重磅发布

    程序语言与编译器团队和阿里云可观测团队开源了遵循 Opentelemetry 规范的 Golang Agent 0.1.0-RC 版本,希望能通过编译期自动插桩的手段实现无侵入式的 Golang 应用观测。

    653
  • 1
    ...
    50
    51
    52
    ...
    83
    到第