官方博客-第25页-阿里云开发者社区

阿里云云原生

2025-06-30

404

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

404

元毅

2024-05-15

716

解密最受欢迎的开源 Serverless 框架：流量篇

元毅

716

阿里云云原生

2024-05-15

857

MSE Nacos，解决敏感配置的安全隐患

本文向大家介绍，MSE Nacos 是如何解决敏感配置的安全隐患，并提供使用 MSE Nacos 加解密敏感配置的最佳实践。

阿里云云原生

857

德灵

2024-05-15

118027

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,027

ModelScope

2024-05-15

480

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

480

陈浩章颖强

2024-05-29

55697

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,697

阿里云大数据Al技术

2024-08-09

9091

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

9,091

垚佳汐遥

2024-10-23

1000

通义灵码知识库问答增强：知识库构建与管理指南

通义灵码能够结合企业知识库的私域数据，生成贴合企业特点的回答。充分发挥检索增强技术的优势，构建高质量的企业知识数据以及合理的知识库权限管理是必不可少的。本文将为您详细介绍如何构造与管理一个高质量的企业知识库。

垚佳汐遥

1,000

阿里云云原生

2024-11-04

645

只要几句话，通义灵码帮你创建专属健康管理小程序

数字时代的大潮中，编程不再高深莫测，而是每个人都可以尝试并享受的乐趣。今天，就让我们一起探索如何利用通义灵码的自然语言生成代码功能，轻松打造你的专属健康管理小程序，说不定在这个过程中，不管是身材管理，还是编程学习，都能让你离目标更近一步。

阿里云云原生

645

官方博客-第25页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

解密最受欢迎的开源 Serverless 框架：流量篇

MSE Nacos，解决敏感配置的安全隐患

阿里云PAI大模型RAG对话系统最佳实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

基于RAG搭建企业级知识库在线问答

通义灵码知识库问答增强：知识库构建与管理指南

只要几句话，通义灵码帮你创建专属健康管理小程序

官方博客-第25页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

解密最受欢迎的开源 Serverless 框架：流量篇

MSE Nacos，解决敏感配置的安全隐患

阿里云PAI大模型RAG对话系统最佳实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

基于RAG搭建企业级知识库在线问答

通义灵码知识库问答增强：知识库构建与管理指南

只要几句话，通义灵码帮你创建专属健康管理小程序