官方博客-第15页-阿里云开发者社区

子白

2024-05-15

102356

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,356

ModelScope

2024-05-15

743

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

Mistral AI在3月24日突然发布并开源了 Mistral 7B v0.2模型，有如下几个特点

ModelScope

743

ModelScope

2024-05-15

1133

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,133

赵世振

2024-07-30

1837

阿里云百炼应用实践系列-AI助手快速搭建

本文主要介绍如何基于阿里云百炼平台快速在10分钟为您的网站添加一个 AI 助手。我们基于阿里云百炼平台的能力，以官方帮助文档为参考，搭建了一个以便全天候（7x24）回应客户咨询的AI助手，介绍了相关技术方案和主要代码，供开发者参考。

赵世振

1,837

ModelScope

2025-06-16

419

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

419

德灵

2024-05-15

117977

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

117,977

杨永

2024-05-15

1397

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

针对Springboot里面使用开源工具使用加解密，替换成阿里云KMS产品进行加解密；

杨永

1,397

阿里云云原生

2025-05-15

764

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

本文介绍了将社区主流STDIO MCP Server一键转为企业内可插拔Remote MCP Server的方法，以及存量API智能化重生的解决方案。通过FunctionAI平台模板实现STDIO MCP Server到SSE MCP Server的快速部署，并可通过“npx”或“uvx”命令调试。同时，文章还探讨了如何将OpenAPI规范数据转化为MCP Server实例，支持API Key、HTTP Basic和OAuth 2.0三种鉴权配置。该方案联合阿里云百练、魔搭社区等平台，提供低成本、高效率的企业级MCP Server服务化路径，助力AI应用生态繁荣。

阿里云云原生

764

阿里云云原生

2025-05-16

557

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

为了展现 LoongCollector 的卓越性能，本文通过纵向（LoongCollector 与 iLogtail 产品升级对比）和横向（LoongCollector 与其他开源日志采集 Agent 对比）两方面对比，深度测评不同采集 Agent 在常见的日志采集场景下的性能。

阿里云云原生

557

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

元象大模型开源30款量化版本加速低成本部署丨附教程

阿里云百炼应用实践系列-AI助手快速搭建

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

阿里云PAI大模型RAG对话系统最佳实践

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

元象大模型开源30款量化版本 加速低成本部署丨附教程

阿里云百炼应用实践系列-AI助手快速搭建

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

阿里云PAI大模型RAG对话系统最佳实践

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

元象大模型开源30款量化版本加速低成本部署丨附教程