官方博客-第13页-阿里云开发者社区

子白

2024-05-15

102460

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,460

ModelScope

2024-05-15

960

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

960

羿莉

2024-12-17

1614

云上数据安全保护：敏感日志扫描与脱敏实践详解

随着企业对云服务的广泛应用，数据安全成为重要课题。通过对云上数据进行敏感数据扫描和保护，可以有效提升企业或组织的数据安全。本文主要基于阿里云的数据安全中心数据识别功能进行深入实践探索。通过对商品购买日志的模拟，分析了如何使用阿里云的工具对日志数据进行识别、脱敏（3 种模式）处理和基于 StoreView 的查询脱敏方式，从而在保障数据安全的同时满足业务需求。通过这些实践，企业可以有效降低数据泄漏风险，提升数据治理能力和系统安全性。

羿莉

1,614

阿里云云原生

2025-01-22

627

AI 短剧遇上函数计算，一键搭建内容创意平台

为了帮助更多内容创作者和企业快速实现 AI 短剧创作，函数计算 FC 联合百炼联合推出“AI 剧本生成与动画创作解决方案”，通过函数计算 FC 构建 Web 服务，结合百炼模型服务和 ComfyUI 生图平台，实现从故事剧本撰写、插图设计、声音合成和字幕添加到视频合成的一站式自动化流程。创作者只需通过简单操作，就能快速生成高质量的剧本，并一键转化为精美的动画。

阿里云云原生

627

阿里云云原生

2025-05-15

901

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

本文介绍了将社区主流STDIO MCP Server一键转为企业内可插拔Remote MCP Server的方法，以及存量API智能化重生的解决方案。通过FunctionAI平台模板实现STDIO MCP Server到SSE MCP Server的快速部署，并可通过“npx”或“uvx”命令调试。同时，文章还探讨了如何将OpenAPI规范数据转化为MCP Server实例，支持API Key、HTTP Basic和OAuth 2.0三种鉴权配置。该方案联合阿里云百练、魔搭社区等平台，提供低成本、高效率的企业级MCP Server服务化路径，助力AI应用生态繁荣。

阿里云云原生

901

ModelScope

2024-05-15

1218

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,218

ModelScope

2024-05-15

1953

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,953

望雲十雨言澈

2025-04-10

566

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

566

阿里云开发者

2025-04-24

1163

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,163

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

云上数据安全保护：敏感日志扫描与脱敏实践详解

AI 短剧遇上函数计算，一键搭建内容创意平台

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

元象大模型开源30款量化版本加速低成本部署丨附教程

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

AI Infra之模型显存管理分析

为什么一定要做Agent智能体？

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

云上数据安全保护：敏感日志扫描与脱敏实践详解

AI 短剧遇上函数计算，一键搭建内容创意平台

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

元象大模型开源30款量化版本 加速低成本部署丨附教程

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

AI Infra之模型显存管理分析

为什么一定要做Agent智能体？

元象大模型开源30款量化版本加速低成本部署丨附教程