官方博客-第32页-阿里云开发者社区

  • 2024-05-15
    136084

    云原生场景下,AIGC 模型服务的工程挑战和应对

    本文介绍了在云原生场景下,AIGC 模型服务的工程挑战和Fluid 在云原生 AIGC 模型推理场景的优化。

  • 101724

    阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

    阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

  • 2024-05-15
    102327

    大语言模型推理提速,TensorRT-LLM 高性能推理实践

    大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

    102,327
  • 2024-05-15
    1391

    一文详解 Java 限流接口实现

    本文介绍的实现方式属于应用级限制,应用级限流方式只是单应用内的请求限流,不能进行全局限流。要保证系统的抗压能力,限流是一个必不可少的环节,虽然可能会造成某些用户的请求被丢弃,但相比于突发流量造成的系统宕机来说,这些损失一般都在可以接受的范围之内。

    1,391
  • 2024-05-15
    1497

    从方法论到最佳实践,深度解析企业云原生 DevSecOps 体系构建

    本文主要介绍了云原生安全的现状以及企业应用在云原生化转型中面临的主要安全挑战以及相对成熟的一部分安全体系方法论,深度解析企业云原生 DevSecOps 体系构建。

    1,497
  • 2024-05-15
    680

    解密最受欢迎的开源 Serverless 框架:流量篇

    解密最受欢迎的开源 Serverless 框架:流量篇

    680
  • 2024-05-15
    77432

    PolarDB-X Operator 基于两次心跳事务的指定时间点恢复方案介绍

    本文将介绍,PolarDB-X Operator将在事务策略为XA事务或者TSO事务时,如何实现全局一致的任意时间点恢复,提出了基于两次心跳事务的恢复方案。

    77,432
  • 2024-05-15
    67830

    为什么 Lettuce 会带来更长的故障时间

    本文详述了阿里云数据库 Tair/Redis 将使用长连接客户端在非预期故障宕机切换场景下的恢复时间从最初的 900s 降到 120s 再到 30s的优化过程,涉及产品优化,开源产品问题修复等诸多方面。

    67,830
  • 2024-05-15
    113184

    PolarDB-X最佳实践系列(三):如何实现高效的分页查询

    分页查询是数据库中常见的操作。本文将介绍,如何在数据库中(无论是单机还是分布式)高效的进行翻页操作。

  • 1
    ...
    31
    32
    33
    ...
    37
    到第
    32/37