官方博客-第24页-阿里云开发者社区

阿里云云原生

2025-06-30

405

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

405

查斌

2023-04-14

577

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

Nydus+Dragonfly 组合减少容器启动过程中镜像的拉取时间，提升集群间的镜像分发效率。

查斌

577

探索云世界

2024-05-15

40598

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

幻兽帕鲁最近非常火。有些小伙伴可能不喜欢跟陌生人一起玩，那么你可以搭建一个专有服务器和朋友一起联机游戏。自己搭建服务器不仅更私密，还能自定义游戏里的一些选项，比如调整工作速度倍率、经验获取倍率等。这篇教程将引导你在几分钟内快速完成幻兽帕鲁服务器的搭建。

探索云世界

40,598

杨磊

2024-05-15

262753

青团社：亿级灵活用工平台的云原生架构实践

青团社是国内领先的一站式灵活用工招聘服务企业，灵活用工行业的 Top1。青团社于 2013 年在杭州成立，业务已经覆盖全国，在行业深耕 10 年。我的分享将分为以下三部分：青团社架构演进的历程、青团社如何实现云原生、总结与展望。

杨磊

262,753

ModelScope

2024-05-15

921

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

921

隆基

2024-05-15

91446

深度剖析 RocketMQ 5.0，IoT 消息：物联网需要什么样的消息技术？

本文来学习一个典型的物联网技术架构，以及在这个技术架构里面，消息队列所发挥的作用。在物联网的场景里面，对消息技术的要求和面向服务端应用的消息技术有什么区别？学习 RocketMQ 5.0 的子产品 MQTT，是如何解决这些物联网技术难题的。

隆基

91,446

林清山

2024-05-15

112192

RocketMQ 流数据库解析：实现一体化流处理

RocketMQ 5.0 是一款云原生的消息中间件，旨在覆盖更多业务场景。它针对国内企业在数字化转型中面临的多场景消息处理需求，提供了一体化的解决方案。

林清山

112,192

ModelScope

2024-05-15

1127

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,127

探索云世界

2024-05-15

357

OpenSergo/MSE & CloudWeGo 共同保障微服务运行时流量稳定性

微服务运行时稳定性的问题微服务的稳定性一直是开发者非常关注的话题。随着业务从单体架构向分布式架构演进以及部署方式的变化，服务之间的依赖关系变得越来越复杂，业务系统也面临着巨大的高可用挑战。大家可能都经历过以下的场景：演唱会抢票瞬间洪峰流量导致系统超出最大负载，load 飙高，用户无法正常下单；在线选...

探索云世界

357

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

青团社：亿级灵活用工平台的云原生架构实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

深度剖析 RocketMQ 5.0，IoT 消息：物联网需要什么样的消息技术？

RocketMQ 流数据库解析：实现一体化流处理

vLLM部署Yuan2.0：高吞吐、更便捷

OpenSergo/MSE & CloudWeGo 共同保障微服务运行时流量稳定性

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

如何在 Anolis 8 上构建基于 Nydus 和 Dragonfly 的镜像加速解决方案

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

青团社：亿级灵活用工平台的云原生架构实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

深度剖析 RocketMQ 5.0，IoT 消息：物联网需要什么样的消息技术？

RocketMQ 流数据库解析：实现一体化流处理

vLLM部署Yuan2.0：高吞吐、更便捷

OpenSergo/MSE & CloudWeGo 共同保障微服务运行时流量稳定性