2024-05-15
101336

大语言模型推理提速,TensorRT-LLM 高性能推理实践

大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

101,336
2024-06-24
55636

解锁分布式云多集群统一监控的云上最佳实践

为应对分布式云多集群监控的挑战,阿里云可观测监控 Prometheus 版结合 ACK One,凭借高效纳管与全局监控方案有效破解了用户在该场景的监控运维痛点,为日益增长的业务需求提供了一站式、高效、统一的监控解决方案,实现成本与运维效率的双重优化。助力企业的数字化转型与业务快速增长,在复杂多变的云原生时代中航行,提供了一个强有力的罗盘与风帆。

55,636
2024-05-15
145613

弹性调度助力企业灵活应对业务变化,高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化,并高效管理云上资源。

145,613
2023-09-26
138140

云原生场景下高可用架构的最佳实践

云原生场景下高可用架构的最佳实践

138,140
2024-05-15
92640

阿里云云原生弹性方案,用弹性解决集群资源利用率难题

本文主要介绍了通过弹性,实现成本优化,解决集群资源利用率难题。

92,640
2024-06-07
173

自动化搭建专属 AI 绘图服务

本文介绍了如何使用通义万相AIGC技术和阿里云的计算和存储产品来搭建自己的AI绘画服务。首先,通过创建基础云产品资源和部署AI绘画服务的步骤来开始搭建服务。然后,介绍了模板的原理和内容,以及ROS编排引擎的作用。接下来,详细介绍了AI绘画服务的一键部署过程,包括定义参数、模板的编写和ROS的使用。最后,提到了应用运行环境的搭建和自定义应用页面的方法。通过ROS的自动化部署,用户可以方便快捷地拥有自己的AI绘画服务。

2024-06-24
45775

多环境镜像晋级/复用最佳实践

本文介绍了在应用研发场景中,如何通过阿里云服务实现镜像构建部署的高效和安全。主要关注两个实践方法来确保“所发即所测”。

45,775
2024-09-11
75

ROS CDK魔法书:建立你的游戏王国(Java篇)

本文介绍了如何使用阿里云资源编排服务(ROS)的云开发套件(CDK)将2048小游戏部署到云端。ROS CDK允许使用编程语言定义和部署云资源,简化开发流程。ECS(弹性计算服务)提供灵活的计算资源,确保应用稳定运行。通过初始化工程项目、安装依赖、添加资源等步骤,可以轻松实现游戏的云端部署。文中详细描述了各步骤的操作方法及注意事项,帮助读者顺利完成部署。最后,通过简单命令即可删除资源栈,实现资源的高效管理。

2024-07-09
199

使用资源编排 ROS 轻松部署单点网站——以 WordPress 为例

WordPress 是流行的开源CMS,阿里云的ROS(Resource Orchestration Service)提供模板化部署服务,简化云上环境如VPC、ECS、MySQL的创建。用户可通过ROS控制台选择模板一键部署WordPress,配置包括实例区、类型、系统盘及密码等参数。ROS模板定义了资源、参数和输出,自动处理依赖关系,实现云资源和应用的自动化部署。通过ROS,用户可以高效管理和更新整个资源栈,实现快速、可靠的云服务部署。

1
2
3
4
...
7
到第
1
2
3
4
5
6
7
1/7