2024-05-15
101345

大语言模型推理提速,TensorRT-LLM 高性能推理实践

大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

101,345
2024-05-15
145617

弹性调度助力企业灵活应对业务变化,高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化,并高效管理云上资源。

145,617
2024-06-24
55637

解锁分布式云多集群统一监控的云上最佳实践

为应对分布式云多集群监控的挑战,阿里云可观测监控 Prometheus 版结合 ACK One,凭借高效纳管与全局监控方案有效破解了用户在该场景的监控运维痛点,为日益增长的业务需求提供了一站式、高效、统一的监控解决方案,实现成本与运维效率的双重优化。助力企业的数字化转型与业务快速增长,在复杂多变的云原生时代中航行,提供了一个强有力的罗盘与风帆。

55,637
2023-09-26
138143

云原生场景下高可用架构的最佳实践

云原生场景下高可用架构的最佳实践

138,143
2024-05-15
92641

阿里云云原生弹性方案,用弹性解决集群资源利用率难题

本文主要介绍了通过弹性,实现成本优化,解决集群资源利用率难题。

92,641
2024-06-04
677

一键云部署:资源编排 ROS 轻松部署文本转语音系统 ChatTTS

ChatTTS是一款针对对话场景的文本转语音模型,支持英中两种语言,训练数据超过10万小时。ChatTTS可通过WebUI和API访问。阿里云的资源编排服务(ROS)提供了一键部署ChatTTS到云端的方案,用户只需在ROS控制台配置模板参数,如区域和实例类型,即可完成部署。部署后,从资源栈输出获取ChatTTS服务地址。ROS利用IaC理念自动化部署云资源和应用,提高了部署效率和稳定性。

2024-06-07
179

自动化搭建专属 AI 绘图服务

本文介绍了如何使用通义万相AIGC技术和阿里云的计算和存储产品来搭建自己的AI绘画服务。首先,通过创建基础云产品资源和部署AI绘画服务的步骤来开始搭建服务。然后,介绍了模板的原理和内容,以及ROS编排引擎的作用。接下来,详细介绍了AI绘画服务的一键部署过程,包括定义参数、模板的编写和ROS的使用。最后,提到了应用运行环境的搭建和自定义应用页面的方法。通过ROS的自动化部署,用户可以方便快捷地拥有自己的AI绘画服务。

2024-06-24
45776

多环境镜像晋级/复用最佳实践

本文介绍了在应用研发场景中,如何通过阿里云服务实现镜像构建部署的高效和安全。主要关注两个实践方法来确保“所发即所测”。

45,776
2024-09-11
76

ROS CDK魔法书:建立你的游戏王国(Java篇)

本文介绍了如何使用阿里云资源编排服务(ROS)的云开发套件(CDK)将2048小游戏部署到云端。ROS CDK允许使用编程语言定义和部署云资源,简化开发流程。ECS(弹性计算服务)提供灵活的计算资源,确保应用稳定运行。通过初始化工程项目、安装依赖、添加资源等步骤,可以轻松实现游戏的云端部署。文中详细描述了各步骤的操作方法及注意事项,帮助读者顺利完成部署。最后,通过简单命令即可删除资源栈,实现资源的高效管理。

1
2
3
4
...
7
到第
1
2
3
4
5
6
7
1/7