子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,236

寒斜

2024-06-24

34329

AI 克隆声音，只需 3 分钟（附最全教程）

文章介绍了GPT-Sovits，一个开源的生成式语音模型，因其在声音克隆上的高质量和简易性而受到关注。阿里云函数计算（Function Compute）提供了一个快速托管GPT-Sovits的方法，让用户无需管理服务器即可体验和部署该模型。通过函数计算，用户可以便捷地搭建基于GPT-Sovits的文本到语音服务，并享受到按需付费和弹性扩展的云服务优势。此外，文章还列举了GPT-Sovits在教育、游戏、新能源等多个领域的应用场景，并提供了详细的步骤指导，帮助用户在阿里云上部署和体验GPT-Sovits模型。

寒斜

34,329

杨永

2024-06-13

404

使用KMS为Apollo配置中心敏感配置加密的最佳实践

杨永

404

子丑

2024-07-22

15571

超越流水线，企业研发规范落地新思路

一文详解研发规范的目标、常见误区、选型方法与常见最佳实践。

子丑

15,571

孟威

2024-05-15

104278

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

104,278

子丑雅纯

2024-05-15

122147

提升团队工程交付能力，从“看见”工程活动和研发模式开始

本文从统一工程交付的概念模型开始，介绍了如何将应用交付的模式显式地定义出来，并通过工具平台落地。

子丑雅纯

122,147

闵子

2023-12-01

1178

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

1,178

探索云世界

2024-05-15

458

3步教你在云服务器上做Github DevOps部署

本文指导您使用阿里云DevOps工具云效，将Github中托管的代码部署在云服务器ECS中，使得用户能够在互联网公网中访问个人应用服务。文章来自云服务器ECS开发实践征文活动用户投稿，已获得作者（昵称秋天）授权发布。

探索云世界

458

阿里云云原生

2024-08-22

19228

一线实战：运维人少，我们从 0 到 1 实践 DevOps 和云原生

上海经证科技有限公司为有效推进软件项目管理和开发工作，选择了阿里云云效作为 DevOps 解决方案。通过云效，实现了从 0 开始，到现在近百个微服务、数百条流水线与应用交付的全面覆盖，有效支撑了敏捷开发流程。

阿里云云原生

19,228

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

AI 克隆声音，只需 3 分钟（附最全教程）

使用KMS为Apollo配置中心敏感配置加密的最佳实践

超越流水线，企业研发规范落地新思路

SLS 大模型可观测&安全推理审计标准解决方案

提升团队工程交付能力，从“看见”工程活动和研发模式开始

从浏览器原理出发聊聊Chrome插件

3步教你在云服务器上做Github DevOps部署

一线实战：运维人少，我们从 0 到 1 实践 DevOps 和云原生