官方博客-第21页-阿里云开发者社区

亦达

2025-02-20

695

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

695

恶来

2023-05-15

7447

消息队列之 MetaQ 和 Kafka 区别和优势详解

本篇文章介绍MetaQ和Kafka这两个消息队列的区别和优势。

恶来

7,447

王明橙鲤黄俊

2024-05-15

64104

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,104

隆基

2024-05-15

109225

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

本文主要学习 RocketMQ 的一致性特性，一致性对于交易、金融都是刚需。从大规模复杂业务出发，学习 RocketMQ 的 SQL 订阅、定时消息等特性。再从高可用的角度来看，这里更多的是大型公司对于高阶可用性的要求，如同城容灾、异地多活等。

隆基

109,225

张昕东

2024-07-25

14020

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

14,020

羿莉

2024-08-06

8774

基于“日志审计应用”的 DNS 日志洞察实践

DNS 解析日志是一种记录 DNS 请求和响应的基础信息，监控 DNS 服务可以帮助用户识别网络活动并保持系统安全。日志审计服务支持采集 DNS 内网解析日志、公网权威解析日志、GTM 日志。理解 DNS 日志的字段含义，洞察 DNS 日志背后所代表的网络信息，既可以帮助发现和诊断 DNS 解析相关的问题，还可以检测和识别潜在的安全威胁。

羿莉

8,774

牛俊

2024-08-15

11736

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,736

阿里云云原生

2024-09-25

741

新场景、新能力，AI-native 时代的可观测革新

借助 AI-native 可观测解决方案，阿里云为用户提供开箱即用的覆盖大模型应用、大模型到基础设施的全链路实时观测、告警与诊断能力，帮助企业在复杂的数字化转型过程中更有效地确保资源的高效利用与业务的持续成功。

阿里云云原生

741

丛霄章进十眠

2024-11-06

1692

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘

SAE 会继续致力于为用户提供极简易用、成本低廉、功能强大的 Serverless 应用全托管平台：“我们希望让用户做的更少而收获更多，通过 Serverless 化，深度用云就像用水电煤一样简单”。

丛霄章进十眠等

1,692

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

消息队列之 MetaQ 和 Kafka 区别和优势详解

通义千问开源模型在PAI灵骏的最佳实践

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

基于“日志审计应用”的 DNS 日志洞察实践

动手实践：高效构建企业级AI搜索

新场景、新能力，AI-native 时代的可观测革新

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

消息队列之 MetaQ 和 Kafka 区别和优势详解

通义千问开源模型在PAI灵骏的最佳实践

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

基于“日志审计应用”的 DNS 日志洞察实践

动手实践：高效构建企业级AI搜索

新场景、新能力，AI-native 时代的可观测革新

Serverless 微服务治理神器： 阿里云 SAE 全链路灰度揭秘

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘