2024-05-15
101252

大语言模型推理提速,TensorRT-LLM 高性能推理实践

大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

101,252
2024-06-13
417

使用KMS为Apollo配置中心敏感配置加密的最佳实践

使用KMS为Apollo配置中心敏感配置加密的最佳实践

417

实时数仓Hologres OLAP场景核心能力介绍

Hologres提供统一、实时、弹性、易用的一站式实时数仓引擎,解决复杂OLAP难题。

2024-07-11
90

使用资源编排 ROS 轻松部署高可用架构网站——以 WordPress 为例

WordPress 是流行的开源 CMS,阿里云的资源编排服务 (ROS) 提供 IaC 功能,简化云上资源自动化部署,如创建 VPC、ECS、SLB、RDS 和弹性伸缩等。通过 ROS 模板(JSON/YAML),用户能快速部署高可用的 WordPress 环境,包括负载均衡、多可用区的 ECS 服务器集群、高可用 RDS 数据库等。模板定义了资源、参数和输出,用户在 ROS 控制台配置参数后一键部署。ROS 提升了部署效率,便于跨地域复制相同架构。

2024-09-11
23

ROS CDK魔法书:建立你的游戏王国(Python篇)

在虚拟游戏世界中,阿里云ROS CDK让游戏部署变得简单高效。ROS CDK是一个强大的开发框架,通过IaC方式简化云资源管理,帮助游戏开发者轻松创建、配置和部署云资源。本文将指导您使用ROS CDK将2048小游戏快速部署到云端,涵盖环境准备、依赖安装、资源栈创建及部署等步骤,让您体验从本地到云端的无缝迁移。通过简单的代码配置,即可实现游戏的云端部署,享受流畅的游戏体验。

2024-09-11
22

ROS CDK魔法书:建立你的游戏王国(Java篇)

本文介绍了如何使用阿里云资源编排服务(ROS)的云开发套件(CDK)将2048小游戏部署到云端。ROS CDK允许使用编程语言定义和部署云资源,简化开发流程。ECS(弹性计算服务)提供灵活的计算资源,确保应用稳定运行。通过初始化工程项目、安装依赖、添加资源等步骤,可以轻松实现游戏的云端部署。文中详细描述了各步骤的操作方法及注意事项,帮助读者顺利完成部署。最后,通过简单命令即可删除资源栈,实现资源的高效管理。

分析性能提升40%,阿里云Hologres流量场景最佳实践

分析性能提升40%,阿里云Hologres流量场景最佳实践

2024-05-15
785

从方法论到最佳实践,深度解析企业云原生 DevSecOps 体系构建

本文主要介绍了云原生安全的现状以及企业应用在云原生化转型中面临的主要安全挑战以及相对成熟的一部分安全体系方法论,深度解析企业云原生 DevSecOps 体系构建。

785
2024-06-24
55590

解锁分布式云多集群统一监控的云上最佳实践

为应对分布式云多集群监控的挑战,阿里云可观测监控 Prometheus 版结合 ACK One,凭借高效纳管与全局监控方案有效破解了用户在该场景的监控运维痛点,为日益增长的业务需求提供了一站式、高效、统一的监控解决方案,实现成本与运维效率的双重优化。助力企业的数字化转型与业务快速增长,在复杂多变的云原生时代中航行,提供了一个强有力的罗盘与风帆。

55,590
1
2
3
4
...
19
到第
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
2/19