官方博客-第8页-阿里云开发者社区

子白

2024-05-15

102414

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,414

豁朗

2024-05-15

897

用SLS配置日志关键字告警的N种方法

本文由日志关键词告警出发，介绍了使用SLS进行关键词监控告警配置，并且介绍了几种常见的配置方法，可以覆盖关键词监控的大部分场景。

豁朗

897

喻奎

2024-08-23

281

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

本文主要介绍基于 MaxCompute 的离线近实时一体化新架构如何来支持这些综合的业务场景，提供基于Delta Table的近实时增全量一体的数据存储和计算解决方案。

喻奎

281

阿里云存储

2024-10-08

1360

Data+AI双轮驱动，阿里云存储服务全面升级

近日，2024云栖大会现场，阿里云宣布对其存储服务进行全面升级，围绕 Storage for AI 与 AI in Storage 两大领域，提出“4 Any + 3 AI ”的升级方向，揭示存储基础设施与AI的双向赋能路径。阿里云存储产品将支持更多AI业务高效创新，同时 AI 技术也将助力基础设施迭代，支持企业更好地管理数据资产。

阿里云存储

1,360

阿里云瑶池数据库

2024-06-25

24739

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

在今年的SIGMOD会议上，阿里云瑶池数据库团队的论文《PolarDB-MP: A Multi-Primary Cloud-Native Database via Disaggregated Shared Memory》获得了Industry Track Best Paper Award，这是中国企业独立完成的成果首次摘得SIGMOD最高奖。PolarDB-MP是基于分布式共享内存的多主云原生数据库，本文将介绍这篇论文的具体细节。

阿里云瑶池数据库

24,739

寒斜

2024-10-11

997

打造你的专属语音助手，基于函数计算托管 CosyVoice 语音模型

今天分享一下，基于阿里云函数计算 FC 以及 CAP（云应用开发平台），极速托管专属的 CosyVoice 应用。并且我们提供了 API 调用方案以及镜像构建源码方便您根据自己的业务任意 DIY。

寒斜

997

元昌

2024-11-21

585

构建理想容器镜像——以CSI为例

本文围绕阿里云CSI（Container Storage Interface）镜像构建的实际案例，探讨了一系列优化容器镜像的最佳实践。

元昌

585

阿里云云原生

2025-01-06

1811

5 分钟复刻你的声音，一键实现 GPT-Sovits 模型部署

想象一下，只需简单几步操作，就能生成逼真的语音效果，无论是为客户服务还是为游戏角色配音，都能轻松实现。GPT-Sovits 模型，其高效的语音生成能力为实现自然、流畅的语音交互提供了强有力的技术支持。本文将详细介绍如何利用函数计算平台部署 GPT-Sovits 模型，以构建一个高效、可扩展的 AI 语音交互系统。通过这一部署方案，开发者和企业能够快速集成语音合成功能，实现从文本到语音的无缝转换，进而推动智能语音应用的创新和发展。

阿里云云原生

1,811

尹斌斌周絮

2025-03-21

749

解决隐式内存占用难题

本文详细介绍了在云原生和容器化部署环境中，内存管理和性能优化所面临的挑战及相应的解决方案。

尹斌斌周絮

749

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

用SLS配置日志关键字告警的N种方法

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

Data+AI双轮驱动，阿里云存储服务全面升级

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

打造你的专属语音助手，基于函数计算托管 CosyVoice 语音模型

构建理想容器镜像——以CSI为例

5 分钟复刻你的声音，一键实现 GPT-Sovits 模型部署

解决隐式内存占用难题

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

用SLS配置日志关键字告警的N种方法

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

Data+AI双轮驱动，阿里云存储服务全面升级

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

打造你的专属语音助手，基于函数计算托管 CosyVoice 语音模型

构建理想容器镜像——以CSI为例

5 分钟复刻你的声音，一键实现 GPT-Sovits 模型部署

解决隐式内存占用难题