官方博客-第22页-阿里云开发者社区

亦达

2025-02-20

695

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

695

封崇

2025-04-16

1409

MCP 正当时：FunctionAI MCP 开发平台来了！

MCP 的价值是统一了 Agent 和 LLM 之间的标准化接口，有了 MCP Server 的托管以及开发态能力只是第一步，接下来重要的是做好 MCP 和 Agent 的集成，FunctionAI 即将上线 Agent 开发能力，敬请期待。

封崇

1,409

龙蜥社区OpenAnolis

2023-03-01

671

如何有效降低产品级内存数据库快照尾延迟

本文讲解内存键值对数据库在使用 fork 拍摄快照时引起的请求尾延迟激增问题如何解决的实践方案。

龙蜥社区OpenAnolis

671

偏左

2023-08-28

21361

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

当代AI来势汹汹，本文从AI的特点、对研发的挑战、AI的应用工程和场景分化等剖析了AI时代的应用工程化架构演进之路。

偏左

21,361

周宇睿

2023-09-08

714

MaxCompute半结构化数据思考与创新

本文将介绍MaxCompute在半结构化数据方面的一些思考与创新，围绕半结构化数据简析、传统方案优劣对比、MaxCompute半结构化数据解决方案、收益分析。

周宇睿

714

资源编排ROS

2023-12-01

669

从零开始使用 ROS CDK 搭建云上解决方案

本文介绍了如何使用阿里云ROS资源编排服务快速部署和管理云资源。主要内容包括：1. 工具准备：安装ROSCDK,选择合适的代码编辑器和IDE,安装AI代码生成插件等。2. 环境准备：创建工程目录，进入虚拟环境，配置阿里云凭证信息，配置ROSCDK。3. 代码编写：根据文档描述，编写ROS代码来创建VPC、VSwitch、ECS等资源。4. 运行代码：执行ROS代码，创建ECS实例并部署FTP服务。总体来说，本文通过简单的步骤，让小白也能快速上手使用ROS资源编排服务，实现自动化部署和管理阿里云资源。

资源编排ROS

669

ModelScope

2024-05-15

924

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

924

探索云世界

2024-05-15

109429

吴泳铭：拥抱人工智能驱动的产业智能革命

探索云世界

109,429

阿里云云原生

2024-05-15

410

实践总结｜前端架构设计的一点考究（下）

作者将【DDD、六边形、洋葱、清洁、CQRS】进行深入学习并梳理总结的一个前端架构设计，并且经历一定应用实践的考验。

阿里云云原生

410

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

MCP 正当时：FunctionAI MCP 开发平台来了！

如何有效降低产品级内存数据库快照尾延迟

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

MaxCompute半结构化数据思考与创新

从零开始使用 ROS CDK 搭建云上解决方案

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

吴泳铭：拥抱人工智能驱动的产业智能革命

实践总结｜前端架构设计的一点考究（下）

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

MCP 正当时：FunctionAI MCP 开发平台来了！

如何有效降低产品级内存数据库快照尾延迟

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

MaxCompute半结构化数据思考与创新

从零开始使用 ROS CDK 搭建云上解决方案

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

吴泳铭：拥抱人工智能驱动的产业智能革命

实践总结｜前端架构设计的一点考究（下）