官方博客-第19页-阿里云开发者社区

阿里云云原生

2025-06-30

423

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

423

探索云世界

2022-04-02

29317

【ECS最佳实践】ECS+RDS构建云服务器主动防御系统部署开源蜜罐系统Hfish及ECS周边功能测试

我已经是阿里云ECS产品的老用户了，阿里的云计算产品性能可靠性毋庸置疑，这次分享一个开源蜜罐系统Hfish的单节点搭建，并围绕ECS周边的技术功能做个简单举例。

探索云世界

29,317

ModelScope

2024-05-15

940

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

940

德灵

2024-05-15

118056

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,056

阿里云实时数仓Hologres

2024-05-15

1013

Flink+Paimon+Hologres 构建实时湖仓数据分析

本文整理自阿里云高级专家喻良，在 Flink Forward Asia 2023 主会场的分享。

阿里云实时数仓Hologres

1,013

ModelScope

2024-05-15

1144

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,144

言澈

2024-05-15

1454

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

本文是[全景剖析容器网络数据链路]第三部分，主要介绍Kubernetes Terway ENIIP模式下，数据面链路的转转发链路。

言澈

1,454

ModelScope

2024-05-15

1125

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,125

肖雪珣朱健

2024-07-29

8423

如何在Dataphin中构建Flink+Paimon流式湖仓方案

当前大数据处理工业界非常重要的一个大趋势是一体化，尤其是湖仓一体架构。与过去分散的数据仓库和数据湖不同，湖仓一体架构通过将数据存储和处理融为一体，不仅提升了数据访问速度和处理效率，还简化了数据管理流程，降低了资源成本。企业可以更轻松地实现数据治理和分析，从而快速决策。paimon是国内开源的，也是最年轻的成员。本文主要演示如何在 Dataphin 产品中构建 Flink+Paimon 的流式湖仓方案。

肖雪珣朱健

8,423

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

【ECS最佳实践】ECS+RDS构建云服务器主动防御系统部署开源蜜罐系统Hfish及ECS周边功能测试

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

阿里云PAI大模型RAG对话系统最佳实践

Flink+Paimon+Hologres 构建实时湖仓数据分析

vLLM部署Yuan2.0：高吞吐、更便捷

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

LISA微调技术解析：比LoRA更低的显存更快的速度

如何在Dataphin中构建Flink+Paimon流式湖仓方案

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

【ECS最佳实践】ECS+RDS构建云服务器主动防御系统部署开源蜜罐系统Hfish及ECS周边功能测试

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

阿里云PAI大模型RAG对话系统最佳实践

Flink+Paimon+Hologres 构建实时湖仓数据分析

vLLM部署Yuan2.0：高吞吐、更便捷

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

LISA微调技术解析：比LoRA更低的显存更快的速度

如何在Dataphin中构建Flink+Paimon流式湖仓方案