官方博客-第26页-阿里云开发者社区

阿里云云原生

2025-06-30

405

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

405

阿里云云原生

2025-08-07

328

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

在 AI 与云原生融合的趋势下，开发者面临模型协同与云端扩展的挑战。MCP（模型上下文协议）提供统一的交互规范，简化模型集成与服务开发。Function AI 支持 MCP 代码一键上云，提供绑定代码仓库、OSS 上传、本地交付物部署及镜像部署等多种构建方式，助力开发者高效部署智能服务，实现快速迭代与云端协同。

阿里云云原生

328

德灵

2024-05-15

118028

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,028

隆基

2024-05-15

79317

深度剖析 RocketMQ 5.0，流数据库：如何实现一体化流处理？

本文将从概念和宏观角度理解什么是流处理。 RocketMQ 5.0，学习 RocketMQ 提供的轻量流处理引擎 RStreams，了解其特性和原理。学习 RocketMQ 的流数据库 RSQLDB，通过流存储和流计算的深度结合，看它如何进一步降低流处理使用门槛。

隆基

79,317

ModelScope

2024-05-15

1213

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

ModelScope

1,213

梦实

2024-05-15

524

真·异地多活架构的实现用PolarDB-X

今天我们这篇文章重点来说一下，对于一个分布式数据库，在异地多活架构中，起到了一个什么样的角色；对于其中的问题，解法是什么。

梦实

524

探索云世界

2024-05-15

564

统一观测｜Prometheus 监控多云容器集群

容器集群可观测现状随着 Kubernetes（K8s）容器编排工具已经成为事实上行业通用技术底座，容器集群监控经历多种方案实践后，Prometheus 最终成为容器集群监控的事实标准。Promethues 监控服务可有效监控系统层指标、应用层指标、业务层指标等，采集监控指标后进行存储，搭配 Graf...

探索云世界

564

资源编排ROS

2024-06-24

398

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

基于 IaC 的理念，通过定义一个模板，使用 ROS 提供的 Terraform 托管服务进行自动化部署，可以非常高效快捷地部署任意云资源和应用（比如 ChatTTS 服务）。相比于手动部署或者通过 API、SDK 的部署方式，有着高效、稳定等诸多优势，也是服务上云的最佳实践。

资源编排ROS

398

茏城

2024-06-28

1464

深度｜大模型时代下，基于湖仓一体的数据智能新范式

本次文根据峰会演讲内容整理：分享在大模型时代基于湖仓一体的数据产品演进，以及我们观察到的一些智能开发相关的新范式。

茏城

1,464

官方博客-第26页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

阿里云PAI大模型RAG对话系统最佳实践

深度剖析 RocketMQ 5.0，流数据库：如何实现一体化流处理？

快来与 CodeQwen1.5 结对编程

真·异地多活架构的实现用PolarDB-X

统一观测｜Prometheus 监控多云容器集群

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

深度｜大模型时代下，基于湖仓一体的数据智能新范式

官方博客-第26页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

阿里云PAI大模型RAG对话系统最佳实践

深度剖析 RocketMQ 5.0，流数据库：如何实现一体化流处理？

快来与 CodeQwen1.5 结对编程

真·异地多活架构的实现用PolarDB-X

统一观测｜Prometheus 监控多云容器集群

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

深度｜大模型时代下，基于湖仓一体的数据智能新范式