官方博客-第21页-阿里云开发者社区

才胜南也

2024-09-05

967

RAG效果优化：高质量文档解析详解

本文关于如何将非结构化数据（如PDF和Word文档）转换为结构化数据，以便于RAG（Retrieval-Augmented Generation）系统使用。

才胜南也

967

阿里云瑶池数据库

2024-11-21

1511

拥抱Data+AI｜“全球第一”雅迪如何实现智能营销？DMS+PolarDB注入数据新活力

针对雅迪“云销通App”的需求与痛点，本文将介绍阿里云瑶池数据库DMS+PolarDB for AI提供的一站式Data+AI解决方案，助力销售人员高效用数，全面提升销售管理效率。

阿里云瑶池数据库

1,511

亦达

2025-02-20

700

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

700

言澈

2025-02-28

1167

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,167

王晨

2025-04-03

799

大模型上下文协议 MCP 带来了哪些货币化机会

本文探讨了MCP（Model-Calling Protocol）的兴起及其对AI生态的影响。自2月中旬起，MCP热度显著提升，GitHub Star和搜索指数均呈现加速增长趋势。MCP通过标准化协议连接大模型与外部工具，解决了碎片化集成问题，推动AI应用货币化及生态繁荣。文章分析了MCP与Function Calling的区别，指出MCP更适用于跨平台、标准化场景，而Function Calling在特定实时任务中仍具优势。此外，MCP促进了 supply端（如云厂商、大模型、中间件服务商）和消费端（终端用户）的变革，尤其以Devin和Manus为代表，分别改变了程序员和普通用户的交互方式。

王晨

799

以珩

2025-04-10

489

用自定义插件生成一篇图文并茂的文章

本文是《5步教你创建大模型自定义插件》的下篇，主要就已有的自定义插件中的生图能力为例，演示如何生成一个图文并茂的文章。

以珩

489

寒亭

2023-09-18

47920

一次访问Redis延时高问题排查与总结（2）

本文是一次访问Redis延时高问题排查与总结的续篇，主要讲述了当时没有发现的一些问题和解决方案。

寒亭

47,920

非有

2024-05-15

1478

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

1,478

ModelScope

2024-05-15

927

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

927

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

RAG效果优化：高质量文档解析详解

拥抱Data+AI｜“全球第一”雅迪如何实现智能营销？DMS+PolarDB注入数据新活力

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

进行GPU算力管理

大模型上下文协议 MCP 带来了哪些货币化机会

用自定义插件生成一篇图文并茂的文章

一次访问Redis延时高问题排查与总结（2）

一文详解 Java 限流接口实现

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

RAG效果优化：高质量文档解析详解

拥抱Data+AI｜“全球第一”雅迪如何实现智能营销？DMS+PolarDB注入数据新活力

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

进行GPU算力管理

大模型上下文协议 MCP 带来了哪些货币化机会

用自定义插件生成一篇图文并茂的文章

一次访问Redis延时高问题排查与总结（2）

一文详解 Java 限流接口实现

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent