官方博客-第15页-阿里云开发者社区

  • 2024-05-15
    1184

    vLLM部署Yuan2.0:高吞吐、更便捷

    vLLM是UC Berkeley开源的大语言模型高速推理框架,其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等,一方面可以提升Yuan2.0模型推理部署时的内存使用效率,另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

    1,184
  • 2024-05-15
    422

    多账号共享一套ACR方案

    一家多业务组织的客户来说往往会有多个云账号,分别部署各个业务线的容器服务。但集团可能想使用一套统一的容器镜像仓库(ACR),就会面临多账号内多个ACK共享一套ACR了。那如何合理规划好ACR实例上的命名空间,打通各个业务ACK集群与ACR的网络,包括如何精细化授权,都是客户需要考虑的。

    422
  • 实时数仓Hologres OLAP场景核心能力介绍

    Hologres提供统一、实时、弹性、易用的一站式实时数仓引擎,解决复杂OLAP难题。

  • 2024-12-06
    1062

    【实战干货】AI大模型工程应用于车联网场景的实战总结

    本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势,以及这些技术如何应用于新能源汽车行业的车联网服务中。

    1,062
  • 2025-06-30
    443

    基于 AI 网关和 llmaz,提升 vLLM 推理服务可用性和部署易用性的实践

    本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务,并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力,构建稳定、高可用的大模型服务平台。

  • 2024-05-15
    93222

    阿里云云原生弹性方案,用弹性解决集群资源利用率难题

    本文主要介绍了通过弹性,实现成本优化,解决集群资源利用率难题。

    93,222
  • 2024-05-15
    1507

    使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

    针对Springboot里面使用开源工具使用加解密,替换成阿里云KMS产品进行加解密;

    1,507
  • 2024-05-15
    95395

    AIGC训练场景下的存储特征研究

    在今天这样以AIGC为代表的AI时代下,了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告,来看看AIGC对于存储有哪些具体的性能要求。

  • 1
    ...
    14
    15
    16
    ...
    50
    到第