官方博客-第16页-阿里云开发者社区

ModelScope

2024-05-15

960

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

960

德灵

2024-05-15

118072

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,072

泮圣伟

2024-05-15

847

阿里巴巴服务框架三位一体的选择与实践

服务框架就像铁路的铁轨一样，是互通的基础，只有解决了服务框架的互通，才有可能完成更高层的业务互通，所以用相同的标准统一，合二为一并共建新一代的服务框架是必然趋势。Dubbo3 是Dubbo2 与 HSF 融合而来，是阿里经济体面向内部业务、商业化、开源的唯一标准服务框架。

泮圣伟

847

徒钟

2024-07-19

13981

RocketMQ 作为一款流行的分布式消息中间件，被广泛应用于各种大型分布式系统和微服务中，承担着异步通信、系统解耦、削峰填谷和消息通知等重要的角色。随着技术的演进和业务规模的扩大，安全相关的挑战日益突出，消息系统的访问控制也变得尤为重要。然而，RocketMQ 现有的 ACL 1.0 版本已经无法满足未来的发展。因此，我们推出了 RocketMQ ACL 2.0 升级版，进一步提升 RocketMQ 数据的安全性。本文将介绍 RocketMQ ACL 2.0 的新特性、工作原理，以及相关的配置和实践。

徒钟

13,981

阿里云大数据Al技术

2024-08-09

9131

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

9,131

探索云世界

2024-12-20

865

AI场景下的对象存储OSS数据管理实践

本文介绍了对象存储（OSS）在AI业务中的应用与实践。内容涵盖四个方面：1) 对象存储作为AI数据基石，因其低成本和高弹性成为云上数据存储首选；2) AI场景下的对象存储实践方案，包括数据获取、预处理、训练及推理阶段的具体使用方法；3) 国内主要区域的默认吞吐量提升至100Gbps，优化了大数据量下的带宽需求；4) 常用工具介绍，如OSSutil、ossfs、Python SDK等，帮助用户高效管理数据。重点讲解了OSS在AI训练和推理中的性能优化措施，以及不同工具的特点和应用场景。

探索云世界

865

澄潭计缘望宸

2025-03-14

997

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

997

望宸魁宇

2025-04-07

427

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

是否还记得 2022 年 K8s Ingress Nginx 披露了的 3 个高危安全漏洞（CVE-2021-25745, CVE-2021-25746, CVE-2021-25748），并在那一年宣布停止接收新功能 PR，专注修复并提升稳定性。

望宸魁宇

427

望雲十雨言澈

2025-04-10

568

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

568

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

阿里云PAI大模型RAG对话系统最佳实践

阿里巴巴服务框架三位一体的选择与实践

Apache RocketMQ ACL 2.0 全新升级

基于RAG搭建企业级知识库在线问答

AI场景下的对象存储OSS数据管理实践

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

AI Infra之模型显存管理分析

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

阿里云PAI大模型RAG对话系统最佳实践

阿里巴巴服务框架三位一体的选择与实践

Apache RocketMQ ACL 2.0 全新升级

基于RAG搭建企业级知识库在线问答

AI场景下的对象存储OSS数据管理实践

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

AI Infra之模型显存管理分析