官方博客-第12页-阿里云开发者社区

ModelScope

2024-05-15

1163

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,163

阿里云云原生

2024-05-16

57073

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

57,073

龙蜥社区OpenAnolis

2024-11-06

2929

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

机密计算软硬结合技术保障数据安全。

龙蜥社区OpenAnolis

2,929

赫曦

2024-05-15

93200

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,200

子白

2024-05-15

102459

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,459

ModelScope

2024-05-15

1869

随着企业对云服务的广泛应用，数据安全成为重要课题。通过对云上数据进行敏感数据扫描和保护，可以有效提升企业或组织的数据安全。本文主要基于阿里云的数据安全中心数据识别功能进行深入实践探索。通过对商品购买日志的模拟，分析了如何使用阿里云的工具对日志数据进行识别、脱敏（3 种模式）处理和基于 StoreView 的查询脱敏方式，从而在保障数据安全的同时满足业务需求。通过这些实践，企业可以有效降低数据泄漏风险，提升数据治理能力和系统安全性。

羿莉

1,609

澄潭

2025-04-03

1854

开源 Remote MCP Server 一站式托管来啦！

MCP Server 的实施存在着诸多挑战，特别是在认证授权、服务可靠性和可观测性方面，Higress 作为 AI 原生的 API 网关，提供了完整的开源 MCP Server 托管解决方案，实现存量 API 到 MCP 的协议转换。即将上线的 MCP 市场，将大幅降低开发者构建 MCP Server 的时间和人力成本。

澄潭

1,854

探索云世界

2024-05-15

1543

3步教你在云服务器上做Github DevOps部署

本文指导您使用阿里云DevOps工具云效，将Github中托管的代码部署在云服务器ECS中，使得用户能够在互联网公网中访问个人应用服务。文章来自云服务器ECS开发实践征文活动用户投稿，已获得作者（昵称秋天）授权发布。

探索云世界

1,543

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Multi-Agent实践第7期：智能体的高效协作

云上数据安全保护：敏感日志扫描与脱敏实践详解

开源 Remote MCP Server 一站式托管来啦！

3步教你在云服务器上做Github DevOps部署

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Multi-Agent实践第7期：智能体的高效协作

云上数据安全保护：敏感日志扫描与脱敏实践详解

开源 Remote MCP Server 一站式托管来啦！

3步教你在云服务器上做Github DevOps部署