官方博客-第14页-阿里云开发者社区

赫曦

2024-05-15

93182

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,182

阿里云云原生

2024-05-15

136132

云原生场景下，AIGC 模型服务的工程挑战和应对

本文介绍了在云原生场景下，AIGC 模型服务的工程挑战和Fluid 在云原生 AIGC 模型推理场景的优化。

阿里云云原生

136,132

田双坤禹杨杨孙健翔

2024-05-15

101782

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

田双坤禹杨杨孙健翔等

101,782

子白

2024-05-15

102440

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,440

孟威

2024-05-15

105531

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

105,531

匡大虎

2024-05-15

1557

从方法论到最佳实践，深度解析企业云原生 DevSecOps 体系构建

本文主要介绍了云原生安全的现状以及企业应用在云原生化转型中面临的主要安全挑战以及相对成熟的一部分安全体系方法论，深度解析企业云原生 DevSecOps 体系构建。

匡大虎

1,557

元毅

2024-05-15

726

解密最受欢迎的开源 Serverless 框架：流量篇

元毅

726

霜键

2024-05-15

112898

线程操纵术之更优雅的并行策略

本文详细介绍了并行编程以及一些并行问题案例中的真实业务场景。

霜键

112,898

张佐玮

2023-12-01

1535

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

1,535

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

云原生场景下，AIGC 模型服务的工程挑战和应对

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

大语言模型推理提速，TensorRT-LLM 高性能推理实践

SLS 大模型可观测&安全推理审计标准解决方案

从方法论到最佳实践，深度解析企业云原生 DevSecOps 体系构建

解密最受欢迎的开源 Serverless 框架：流量篇

线程操纵术之更优雅的并行策略

Koordinator 助力云原生应用性能提升，小红书混部技术实践

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

云原生场景下，AIGC 模型服务的工程挑战和应对

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

大语言模型推理提速，TensorRT-LLM 高性能推理实践

SLS 大模型可观测&安全推理审计标准解决方案

从方法论到最佳实践，深度解析企业云原生 DevSecOps 体系构建

解密最受欢迎的开源 Serverless 框架：流量篇

线程操纵术之更优雅的并行策略

Koordinator 助力云原生应用性能提升，小红书混部技术实践