官方博客-第2页-阿里云开发者社区

  • 2024-05-15
    102327

    大语言模型推理提速,TensorRT-LLM 高性能推理实践

    大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

    102,327
  • 2024-11-21
    538

    构建理想容器镜像——以CSI为例

    本文围绕阿里云CSI(Container Storage Interface)镜像构建的实际案例,探讨了一系列优化容器镜像的最佳实践。

    538
  • 2025-03-21
    695

    解决隐式内存占用难题

    本文详细介绍了在云原生和容器化部署环境中,内存管理和性能优化所面临的挑战及相应的解决方案。

  • 2024-05-15
    221994

    Kube Queue:Kubernetes 任务排队的利器

    Kube Queue:Kubernetes 任务排队的利器

    221,994
  • 2024-06-13
    65336

    基于 Nginx Ingress + 云效 AppStack 实现灰度发布

    本文将演示结合云效 AppStack,来看下如何在阿里云 ACK 集群上进行应用的 Ingress 灰度发布。

    65,336
  • 2024-12-10
    553

    更快、更灵活、场景更丰富,云效镜像构建能力升级啦

    本文介绍了云效在镜像构建方面的改进。

    553
  • 2025-01-08
    294

    GitLab 国际站中国大陆等地区停服,如何将数据快速迁移到云效

    对于正在使用 GitLab 国际站托管代码的企业和研发团队,除迁移至极狐 GitLab 外,国内其他主流的 DevOps 平台也具有完备的产品能力,为开发者提供了更多的选择。其中,阿里云云效也提供了针对常见代码托管平台如 GitHub、GitLab 简单便捷的迁移方案,帮助用户快速完成核心代码数据的迁移,确保代码资产安全。

  • 2024-05-15
    93070

    阿里云云原生弹性方案,用弹性解决集群资源利用率难题

    本文主要介绍了通过弹性,实现成本优化,解决集群资源利用率难题。

    93,070
  • 2024-05-15
    1498

    从方法论到最佳实践,深度解析企业云原生 DevSecOps 体系构建

    本文主要介绍了云原生安全的现状以及企业应用在云原生化转型中面临的主要安全挑战以及相对成熟的一部分安全体系方法论,深度解析企业云原生 DevSecOps 体系构建。

    1,498
  • 1
    2
    3
    4
    ...
    8
    到第
    1
    2
    3
    4
    5
    6
    7
    8
    2/8