官方博客-第24页-阿里云开发者社区

亦达

2025-02-20

714

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

714

阿里云基础设施.

2025-05-01

377

ACK AI Profiling：从黑箱到透明的问题剖析

本文从一个通用的客户问题出发，描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查，最后到问题定位与解决、业务执行过程的分析，从而展现一个从黑箱到透明的精细化的剖析过程。

阿里云基础设施.

377

阿里云云原生

2025-05-28

495

不懂 PromQL，AI 智能体帮你玩转大规模指标数据分析

PromQL AI 智能体上线。本文将从自然语言生成 PromQL 实践视角，探讨如何构建知识库、与大模型进行交互、最终生成符合需求的 PromQL 语句。本文还介绍了在 MCP 和云监控控制台下使用 AI 智能体的用例。

阿里云云原生

495

阿里云云原生

2025-08-07

358

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

在 AI 与云原生融合的趋势下，开发者面临模型协同与云端扩展的挑战。MCP（模型上下文协议）提供统一的交互规范，简化模型集成与服务开发。Function AI 支持 MCP 代码一键上云，提供绑定代码仓库、OSS 上传、本地交付物部署及镜像部署等多种构建方式，助力开发者高效部署智能服务，实现快速迭代与云端协同。

阿里云云原生

358

阿里云实时数仓Hologres

2024-05-15

109900

基于 Hologres+Flink 的曹操出行实时数仓建设

本文主要介绍曹操出行实时计算负责人林震，基于 Hologres+Flink 的曹操出行实时数仓建设的解决方案分享。

阿里云实时数仓Hologres

109,900

阿里云云原生

2024-05-15

44111

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

在本文中，作者探讨了ZooKeeper（ZK）的一个内存占用问题，特别是当有大量的Watcher和ZNode时，导致的内存消耗。

阿里云云原生

44,111

阿里云实时数仓Hologres

2024-06-18

2314

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

2,314

穿杨

2024-08-21

407

谈谈优雅的钩子--bpftrace

bpftrace是一个内核跟踪工具，简单来说就是在函数上挂个钩子，挂上钩子后就可以将函数的入参和返回值取出来再放入程序进行二次编程，最终能让程序按照我们的意图来对函数进行观测。

穿杨

407

喻奎

2024-08-23

298

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

本文主要介绍基于 MaxCompute 的离线近实时一体化新架构如何来支持这些综合的业务场景，提供基于Delta Table的近实时增全量一体的数据存储和计算解决方案。

喻奎

298

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

ACK AI Profiling：从黑箱到透明的问题剖析

不懂 PromQL，AI 智能体帮你玩转大规模指标数据分析

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

基于 Hologres+Flink 的曹操出行实时数仓建设

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

森马基于MaxCompute+Hologres+DataWorks构建数据中台

谈谈优雅的钩子--bpftrace

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

ACK AI Profiling：从黑箱到透明的问题剖析

不懂 PromQL，AI 智能体帮你玩转大规模指标数据分析

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

基于 Hologres+Flink 的曹操出行实时数仓建设

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

森马基于MaxCompute+Hologres+DataWorks构建数据中台

谈谈优雅的钩子--bpftrace

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍