官方博客-阿里云开发者社区

同涛

2024-09-03

7217

一文详解容器技术简介和基本原理

本文全面阐述了容器技术的发展历程、关键技术、架构和当前的行业生态，特别是容器技术在云环境中的应用和演进。

同涛

7,217

阿里云云原生

2024-05-15

2781

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

本文主要介绍了解析云原生 AI 所遇到的技术挑战和应对方案，随后介绍云原生 AI 领域的关键技术与架构细节，最后分享我们在 ACK 的相关经验及工程实践。

阿里云云原生

2,781

乐忱

2024-06-14

40063

阿里云存储产品高级解决方案架构师欧阳雁（乐忱）分享了中国企业在全闪存高端存储市场的快速增长，指出AI大模型的发展推动了企业级存储市场。去年，高端企业级存储闪存占比约为25%，相较于欧美50%的比例，显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程，包括数据预处理、训练和推理的痛点，以及针对这些环节的存储解决方案，强调了稳定、高性能和生命周期管理的重要性。此外，还介绍了数据预处理的全球加速和弹性临时盘技术，训练阶段的高性能存储架构，推理场景的加速器和AI Agent的应用，以及应对大数据业务的存储考量，如对象存储、闪电立方和冷归档存储产品。

乐忱

40,063

子白

2024-05-15

102599

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,599

元泊

2024-05-15

117982

日志服务 HarmonyOS NEXT 日志采集最佳实践

鸿蒙操作系统（HarmonyOS）上的日志服务（SLS）SDK 提供了针对 IoT、移动端到服务端的全场景日志采集、处理和分析能力，旨在满足万物互联时代下应用的多元化设备接入、高效协同和安全可靠运行的需求。

元泊

117,982

吴昆

2024-05-15

222169

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,169

探索云世界

2024-12-20

1019

AI场景下的对象存储OSS数据管理实践

本文介绍了对象存储（OSS）在AI业务中的应用与实践。内容涵盖四个方面：1) 对象存储作为AI数据基石，因其低成本和高弹性成为云上数据存储首选；2) AI场景下的对象存储实践方案，包括数据获取、预处理、训练及推理阶段的具体使用方法；3) 国内主要区域的默认吞吐量提升至100Gbps，优化了大数据量下的带宽需求；4) 常用工具介绍，如OSSutil、ossfs、Python SDK等，帮助用户高效管理数据。重点讲解了OSS在AI训练和推理中的性能优化措施，以及不同工具的特点和应用场景。

探索云世界

1,019

探索云世界

2024-12-20

1028

AI场景下的对象存储OSS数据管理实践

本文介绍了ECS和OSS的操作流程，分为两大部分。第一部分详细讲解了ECS的登录、密码重置、安全组设置及OSSUTIL工具的安装与配置，通过实验创建并管理存储桶，上传下载文件，确保资源及时释放。第二部分则聚焦于OSSFS工具的应用，演示如何将对象存储挂载为磁盘，进行大文件加载与模型训练，强调环境搭建（如Conda环境）及依赖安装步骤，确保实验结束后正确清理AccessKey和相关资源。整个过程注重操作细节与安全性，帮助用户高效利用云资源完成实验任务。

探索云世界

1,028

正己

2025-01-06

426

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

Kubernetes 体系基于 DNS 的服务发现为开发者提供了很大的便利，但其高度复杂的架构往往带来更高的稳定性风险。以 Nacos 为代表的独立服务发现系统架构简单，在 Kubernetes 中选择独立服务发现系统可以帮助增强业务可靠性、可伸缩性、性能及可维护性，对于规模大、增长快、稳定性要求高的业务来说是一个较理想的服务发现方案。希望大家都能找到适合自己业务的服务发现系统。

正己

426

官方博客-阿里云开发者社区

类目筛选

内容类型

一文详解容器技术简介和基本原理

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

AI时代：云存储加速多模态数据存储与管理创新

大语言模型推理提速，TensorRT-LLM 高性能推理实践

日志服务 HarmonyOS NEXT 日志采集最佳实践

Kube Queue：Kubernetes 任务排队的利器

AI场景下的对象存储OSS数据管理实践

AI场景下的对象存储OSS数据管理实践

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

官方博客-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

一文详解容器技术简介和基本原理

为大模型工程提效，基于阿里云 ACK 的云原生 AI 工程化实践

AI时代：云存储加速多模态数据存储与管理创新

大语言模型推理提速，TensorRT-LLM 高性能推理实践

日志服务 HarmonyOS NEXT 日志采集最佳实践

Kube Queue：Kubernetes 任务排队的利器

AI场景下的对象存储OSS数据管理实践

AI场景下的对象存储OSS数据管理实践

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施