官方博客-阿里云开发者社区

同涛

2024-09-03

6679

一文详解容器技术简介和基本原理

本文全面阐述了容器技术的发展历程、关键技术、架构和当前的行业生态，特别是容器技术在云环境中的应用和演进。

同涛

6,679

骆天

2024-05-15

3769

高并发架构设计三大利器：缓存、限流和降级

软件系统有三个追求：高性能、高并发、高可用，俗称三高。本篇讨论高并发，从高并发是什么到高并发应对的策略、缓存、限流、降级等。

骆天

3,769

云服务器ECS

2023-10-17

2281

使用ECS部署并使用Docker

本文介绍如何在云服务ECS实例上，部署并使用Docker。

云服务器ECS

2,281

阿里云云原生

2024-05-15

2542

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

本文主要介绍了解析云原生 AI 所遇到的技术挑战和应对方案，随后介绍云原生 AI 领域的关键技术与架构细节，最后分享我们在 ACK 的相关经验及工程实践。

阿里云云原生

2,542

刘佳旭

2023-09-26

139043

云原生场景下高可用架构的最佳实践

刘佳旭

139,043

阿里云网络

2024-05-15

129417

重磅解读阿里云云网络领域关键技术创新

2023年10月31日，杭州·云栖大会，阿里云技术主论坛带来了一场关于阿里云主力产品与技术创新的深度解读，阿里云网络产品线负责人祝顺民带来《云智创新，网络随行》的主题发言，针对阿里云飞天洛神云网络（下文简称洛神网络）领域产品服务创新以及背后的技术积累进行了深度解读，不少背后的创新技术系首次重磅披露。

阿里云网络

129,417

子白

2024-05-15

102480

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,480

言澈

2025-02-28

1204

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,204

赫曦

2024-05-15

93217

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,217

官方博客-阿里云开发者社区

类目筛选

内容类型

一文详解容器技术简介和基本原理

高并发架构设计三大利器：缓存、限流和降级

使用ECS部署并使用Docker

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

云原生场景下高可用架构的最佳实践

重磅解读阿里云云网络领域关键技术创新

大语言模型推理提速，TensorRT-LLM 高性能推理实践

进行GPU算力管理

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

官方博客-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

一文详解容器技术简介和基本原理

高并发架构设计三大利器：缓存、限流和降级

使用ECS部署并使用Docker

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

云原生场景下高可用架构的最佳实践

重磅解读阿里云云网络领域关键技术创新

大语言模型推理提速，TensorRT-LLM 高性能推理实践

进行GPU算力管理

阿里云云原生弹性方案，用弹性解决集群资源利用率难题