官方博客-第25页-阿里云开发者社区

亦达

2025-02-20

700

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

700

望宸魁宇

2025-04-07

398

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

是否还记得 2022 年 K8s Ingress Nginx 披露了的 3 个高危安全漏洞（CVE-2021-25745, CVE-2021-25746, CVE-2021-25748），并在那一年宣布停止接收新功能 PR，专注修复并提升稳定性。

望宸魁宇

398

阿里云实时计算Flink

2023-03-30

4967

Apache Paimon 在同程旅行的探索实践

本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。

阿里云实时计算Flink

4,967

石樵

2023-12-01

2996

分布式锁实现原理与最佳实践

在单体的应用开发场景中涉及并发同步时，大家往往采用Synchronized（同步）或同一个JVM内Lock机制来解决多线程间的同步问题。而在分布式集群工作的开发场景中，就需要一种更加高级的锁机制来处理跨机器的进程之间的数据同步问题，这种跨机器的锁就是分布式锁。接下来本文将为大家分享分布式锁的最佳实践。

石樵

2,996

吴昆

2024-05-15

222068

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,068

斜阳

2024-05-15

133381

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

133,381

ModelScope

2024-05-15

1369

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

1,369

涯海

2024-05-15

526

链路追踪（Tracing）其实很简单——链路拓扑

最近一年，小玉所在的业务部门发起了轰轰烈烈的微服务化运动，大量业务中台应用被拆分成更细粒度的微服务应用。为了迎接即将到来的双十一大促重保活动，小玉的主管让她在一周内梳理出订单中心的全局关键上下游依赖，提前拉...

涯海

526

言澈

2024-05-15

1113

全景剖析阿里云容器网络数据链路（六）—— ASM Istio

本文是[全景剖析容器网络数据链路]第六部分部分，主要介绍ASM Istio模式下，数据面链路的转转发链路。

言澈

1,113

官方博客-第25页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

Apache Paimon 在同程旅行的探索实践

分布式锁实现原理与最佳实践

Kube Queue：Kubernetes 任务排队的利器

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

链路追踪（Tracing）其实很简单——链路拓扑

全景剖析阿里云容器网络数据链路（六）—— ASM Istio

官方博客-第25页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

Apache Paimon 在同程旅行的探索实践

分布式锁实现原理与最佳实践

Kube Queue：Kubernetes 任务排队的利器

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

链路追踪（Tracing）其实很简单——链路拓扑

全景剖析阿里云容器网络数据链路（六）—— ASM Istio