官方博客-第23页-阿里云开发者社区

亦达

2025-02-20

695

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

695

尹斌斌周絮

2025-03-21

753

解决隐式内存占用难题

本文详细介绍了在云原生和容器化部署环境中，内存管理和性能优化所面临的挑战及相应的解决方案。

尹斌斌周絮

753

王明橙鲤黄俊

2024-05-15

64104

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,104

炎火

2024-05-15

738

安全防御四部曲---检测实践方案（多产品结合）

本次方案主要是针对阿里云国际站客户，企业在实际使用阿里云的过程中如何做好运维检测的一些多产品结合的方案介绍。本篇文章的重点会放在检测（Detection）部分，会具体介绍涉及使用产品配置，FAQ等等，同时对整体的理论框架进行简单的介绍，帮助大家更好理解本部分在运维工作中的分属情况，更好的建立整体性的概念。

炎火

738

阿里云实时数仓Hologres

2024-07-23

25210

分析性能提升40%，阿里云Hologres流量场景最佳实践

阿里云实时数仓Hologres

25,210

张昕东

2024-07-25

14020

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,020

陈浩章颖强

2024-08-23

276

ICDE’24 | 中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

数据库领域顶会 ICDE 2024于5月13-17日在荷兰乌特勒支（Utrecht, Netherlands）举办。ICDE (The International Conference on Data Engineering) 与VLDB、SIGMOD被公认为是国际数据管理领域三大顶级学术会议，此次在荷兰召开的ICDE 2024大会，共吸引北京大学、清华大学、浙江大学、MIT、斯坦福等机构，以及谷歌、微软、阿里云、华为、字节等公司的近1000名人员参会，共同探讨AI、数据库、数据处理领域的前沿技术问题。

陈浩章颖强

276

飒爽

2024-09-04

536

用Prompt技巧激发无限创意

本文深入探讨当前最前沿的prompt engineering方案，结合OpenAI、Anthropic和Google等大模型公司的资料，以及开源社区中宝贵的prompt技巧分享，全面解析这一领域的实践策略。

飒爽

536

丛霄章进十眠

2024-11-06

1692

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘

SAE 会继续致力于为用户提供极简易用、成本低廉、功能强大的 Serverless 应用全托管平台：“我们希望让用户做的更少而收获更多，通过 Serverless 化，深度用云就像用水电煤一样简单”。

丛霄章进十眠等

1,692

官方博客-第23页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

解决隐式内存占用难题

通义千问开源模型在PAI灵骏的最佳实践

安全防御四部曲---检测实践方案（多产品结合）

分析性能提升40%，阿里云Hologres流量场景最佳实践

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

ICDE’24 | 中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

用Prompt技巧激发无限创意

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘

官方博客-第23页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

解决隐式内存占用难题

通义千问开源模型在PAI灵骏的最佳实践

安全防御四部曲---检测实践方案 （多产品结合）

分析性能提升40%，阿里云Hologres流量场景最佳实践

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

ICDE’24 | 中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

用Prompt技巧激发无限创意

Serverless 微服务治理神器： 阿里云 SAE 全链路灰度揭秘

安全防御四部曲---检测实践方案（多产品结合）

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘