官方博客-第23页-阿里云开发者社区

亦达

2025-02-20

799

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

799

龙蜥社区OpenAnolis

2023-03-01

727

如何有效降低产品级内存数据库快照尾延迟

本文讲解内存键值对数据库在使用 fork 拍摄快照时引起的请求尾延迟激增问题如何解决的实践方案。

龙蜥社区OpenAnolis

727

查斌

2023-04-14

623

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

Nydus+Dragonfly 组合减少容器启动过程中镜像的拉取时间，提升集群间的镜像分发效率。

查斌

623

云服务器ECS

2023-07-10

4581

一键配置版：搭建高可用的微信/支付宝小程序服务

本文提供在阿里云云服务器ECS上基于CentOS 7.9 64位操作系统搭建高可用的小程序服务端的指引。同时指导您在本地开发一个简单的微信/支付宝小程序——ECS小助手，通过远程调用部署在ECS上的服务端，实现在小程序中输入框输入ECS实例ID查询实例详细信息的功能。

云服务器ECS

4,581

斜阳

2024-05-15

133437

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

133,437

阿里云存储

2024-05-15

95454

AIGC训练场景下的存储特征研究

在今天这样以AIGC为代表的AI时代下，了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告，来看看AIGC对于存储有哪些具体的性能要求。

阿里云存储

95,454

祎程

2024-06-19

682

通过OOS定时升级Redis实例临时带宽

阿里云OOS提供了定时升级Redis实例临时带宽的功能，以应对数据驱动业务中的流量高峰。这个功能允许用户根据预测的业务负载，在特定日期和时间自动增加Redis实例的带宽，确保服务性能和稳定性。在高流量事件结束后，带宽会自动恢复到原设置，节省成本。此功能适用于电商平台促销、大型游戏更新等场景，确保在流量高峰期间的系统稳定运行。

祎程

682

玄飏

2024-07-04

37113

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

相较于 AliyunLogConfig，AliyunPipelineConfig 在配置格式、行为逻辑上做了很大改进，主打灵活、简单、稳定。点击本文，手把手教你如何配置 AliyunPipelineConfig，欢迎大家使用~

玄飏

37,113

飒爽

2024-09-04

603

用Prompt技巧激发无限创意

本文深入探讨当前最前沿的prompt engineering方案，结合OpenAI、Anthropic和Google等大模型公司的资料，以及开源社区中宝贵的prompt技巧分享，全面解析这一领域的实践策略。

飒爽

603

官方博客-第23页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

如何有效降低产品级内存数据库快照尾延迟

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

一键配置版：搭建高可用的微信/支付宝小程序服务

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

AIGC训练场景下的存储特征研究

通过OOS定时升级Redis实例临时带宽

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

用Prompt技巧激发无限创意

官方博客-第23页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

如何有效降低产品级内存数据库快照尾延迟

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

一键配置版：搭建高可用的微信/支付宝小程序服务

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

AIGC训练场景下的存储特征研究

通过OOS定时升级Redis实例临时带宽

一文带你玩转全新采集配置 CRD：AliyunPipelineConfig

用Prompt技巧激发无限创意