官方博客-第20页-阿里云开发者社区

阿里云云原生

2025-06-30

404

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

404

元毅

2024-05-15

716

解密最受欢迎的开源 Serverless 框架：流量篇

元毅

716

阿里云云原生

2024-05-15

857

MSE Nacos，解决敏感配置的安全隐患

本文向大家介绍，MSE Nacos 是如何解决敏感配置的安全隐患，并提供使用 MSE Nacos 加解密敏感配置的最佳实践。

阿里云云原生

857

德灵

2024-05-15

118027

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,027

ModelScope

2024-05-15

480

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

480

阿里云大数据Al技术

2024-08-09

9091

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

9,091

问思望宸

2024-08-12

8687

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

本文分享了作为一款全能型网关【云原生 API 网关】是如何帮助企业落地统一网关架构的。

问思望宸

8,687

阿里云云原生

2024-11-04

645

只要几句话，通义灵码帮你创建专属健康管理小程序

数字时代的大潮中，编程不再高深莫测，而是每个人都可以尝试并享受的乐趣。今天，就让我们一起探索如何利用通义灵码的自然语言生成代码功能，轻松打造你的专属健康管理小程序，说不定在这个过程中，不管是身材管理，还是编程学习，都能让你离目标更近一步。

阿里云云原生

645

唐三望宸白玙榆松十眠稚柳等

2025-01-24

444

海外泼天流量丨浅谈全球化技术架构

全球化是对技术架构的终极挑战，面临的不仅仅是技术的问题，而是包含了经济、文化等多因素差异的用户关系问题。积极借助遍布全球的云计算基础设施和云原生的架构设计原则，将能更加高效的构建高可用的全球化技术架构，支持全球业务的持续增长。

唐三望宸白玙榆松十眠稚柳等

444

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

解密最受欢迎的开源 Serverless 框架：流量篇

MSE Nacos，解决敏感配置的安全隐患

阿里云PAI大模型RAG对话系统最佳实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

基于RAG搭建企业级知识库在线问答

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

只要几句话，通义灵码帮你创建专属健康管理小程序

海外泼天流量丨浅谈全球化技术架构

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

解密最受欢迎的开源 Serverless 框架：流量篇

MSE Nacos，解决敏感配置的安全隐患

阿里云PAI大模型RAG对话系统最佳实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

基于RAG搭建企业级知识库在线问答

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

只要几句话，通义灵码帮你创建专属健康管理小程序

海外泼天流量丨浅谈全球化技术架构