官方博客-第11页-阿里云开发者社区

子白

2024-05-15

102502

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,502

雅纯

2024-05-15

103674

一文搞懂需求流程规范的制定方法和落地技巧

随着业务和产品的发展、团队的不断扩大，很多团队都不可避免的会遇到需求流程混乱的问题。虽然有的团队也编写了一些“需求流程规范”的文档，但最终却流于纸面，难以在团队真正落地。如何科学制定并有效落实需求管理规范呢？对此，云效产品经理陈逊进行了非常详细的直播分享，本文是他经验的文字总结。

雅纯

103,674

ModelScope

2024-05-15

1453

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

1,453

恭常

2024-09-04

2425

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,425

耘越

2024-10-29

1507

AI 辅助编程的效果衡量

本文主要介绍了如何度量研发效能，以及 AI 辅助编程是如何影响效能的，进而阐述如何衡量 AI 辅助编程带来的收益。

耘越

1,507

殳玄

2025-01-16

1062

现身说法，AI小白的大模型学习路径

写这篇文章的初衷：作为一个AI小白，把我自己学习大模型的学习路径还原出来，包括理解的逻辑、看到的比较好的学习材料，通过一篇文章给串起来，对大模型建立起一个相对体系化的认知，才能够在扑面而来的大模型时代，看出点门道。

殳玄

1,062

君启

2024-11-29

1199

性能提升利器｜PolarDB- X 超详细列存查询技术解读

本文将深入探讨 PolarDB-X 列存查询引擎的分层缓存解决方案，以及其在优化 ORC 列存查询性能中的关键作用。

君启

1,199

阿里云云原生

2025-05-06

1363

MCP 规范新版本特性全景解析与落地实践

MCP Specification 在 2025-03-26 发布了最新的版本，本文对主要的改动进行详细介绍和解释

阿里云云原生

1,363

寒斜

2024-06-24

36564

AI 克隆声音，只需 3 分钟（附最全教程）

文章介绍了GPT-Sovits，一个开源的生成式语音模型，因其在声音克隆上的高质量和简易性而受到关注。阿里云函数计算（Function Compute）提供了一个快速托管GPT-Sovits的方法，让用户无需管理服务器即可体验和部署该模型。通过函数计算，用户可以便捷地搭建基于GPT-Sovits的文本到语音服务，并享受到按需付费和弹性扩展的云服务优势。此外，文章还列举了GPT-Sovits在教育、游戏、新能源等多个领域的应用场景，并提供了详细的步骤指导，帮助用户在阿里云上部署和体验GPT-Sovits模型。

寒斜

36,564

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一文搞懂需求流程规范的制定方法和落地技巧

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

AI 辅助编程的效果衡量

现身说法，AI小白的大模型学习路径

性能提升利器｜PolarDB- X 超详细列存查询技术解读

MCP 规范新版本特性全景解析与落地实践

AI 克隆声音，只需 3 分钟（附最全教程）

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一文搞懂需求流程规范的制定方法和落地技巧

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

AI 辅助编程的效果衡量

现身说法，AI小白的大模型学习路径

性能提升利器｜PolarDB- X 超详细列存查询技术解读

MCP 规范新版本特性全景解析与落地实践

AI 克隆声音，只需 3 分钟（附最全教程）