官方博客-第52页-阿里云开发者社区

  • 2024-05-15
    1120

    vLLM部署Yuan2.0:高吞吐、更便捷

    vLLM是UC Berkeley开源的大语言模型高速推理框架,其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等,一方面可以提升Yuan2.0模型推理部署时的内存使用效率,另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

    1,120
  • 2024-05-15
    44083

    得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

    在本文中,作者探讨了ZooKeeper(ZK)的一个内存占用问题,特别是当有大量的Watcher和ZNode时,导致的内存消耗。

  • 1146

    数据库索引回表困难,揭秘PolarDB存储引擎优化技术

    PolarDB分布式版存储引擎采用CSM方案均衡资源开销与可用性。

  • 333

    Redis Proxy RT上升后连接倾斜

    本文细致地描述了关于Redis Proxy RT上升后连接倾斜问题的排查过程和根本原因,最后给出了优化方案。

  • 2024-08-23
    416

    灵魂拷问-前端的作用--chrome插件篇

    本文会从浏览器插件应用场景切入,穿插插件基础能力和常见入口的介绍,核心回答如下三个问题:插件可以被使用在哪些场景?不同的使用场景我们的主要代码实现思路是怎样的?我们可以从哪些角度入手自己开发一款可以落地实用的浏览器插件?

    416
  • 2024-09-02
    458

    基于 RocketMQ 的云原生 MQTT 消息引擎设计

    本文将介绍阿里云如何将 Serverless 架构应用于消息队列,有效降低运营成本,同时利用云原生环境的特性,为 IoT 设备提供快速响应和灵活伸缩的通讯能力。

  • 2024-09-03
    569

    React 的正确使用方法:ref 篇

    你真的用对了 useRef 吗?在与 TypeScript 一起使用、以及撰写组件库的情况下,你的写法能够避开以下所有场景的坑吗?

    569
  • 2024-09-06
    289

    高基数 GroupBy 在 SLS SQL 中的查询加速

    本文详细介绍了SLS中的高基数GroupBy查询加速技术。

    289
  • 2024-09-11
    318

    表格存储低成本向量检索服务助力 AI 检索

    本文阐述了阿里云表格存储(Tablestore)如何通过其向量检索服务应对大规模数据检索的需求,尤其是在成本、规模和召回率这三个关键挑战方面。

    318
  • 1
    ...
    51
    52
    53
    ...
    84
    到第