官方博客-第8页-阿里云开发者社区

阿里云云原生

2025-02-25

1336

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,336

ModelScope

2024-05-15

2849

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,849

右予故黎

2024-11-21

1240

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

1,240

ant-ray项目组

2025-04-11

1454

AI开源框架：让分布式系统调试不再"黑盒"

Ray是一个开源分布式计算框架，专为支持可扩展的人工智能（AI）和Python应用程序而设计。它通过提供简单直观的API简化分布式计算，使得开发者能够高效编写并行和分布式应用程序。Ray广泛应用于深度学习训练、大规模推理服务、强化学习以及AI数据处理等场景，并构建了丰富而成熟的技术生态。

ant-ray项目组

1,454

扬流

2024-05-15

119333

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

119,333

恭常

2024-09-04

2637

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,637

耘越

2024-10-29

1639

AI 辅助编程的效果衡量

本文主要介绍了如何度量研发效能，以及 AI 辅助编程是如何影响效能的，进而阐述如何衡量 AI 辅助编程带来的收益。

耘越

1,639

阿里云大数据Al技术

2025-07-28

1752

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源，拥有卓越的代码和 Agent 能力，在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。

阿里云大数据Al技术

1,752

ModelScope

2024-05-15

1330

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,330

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

解锁 DeepSeek 安全接入、稳定运行新路径

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

“无”中生有：基于知识增强的RAG优化实践

AI开源框架：让分布式系统调试不再"黑盒"

Paimon 与 Spark 的集成（二）：查询优化

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

AI 辅助编程的效果衡量

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

vLLM部署Yuan2.0：高吞吐、更便捷

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

解锁 DeepSeek 安全接入、稳定运行新路径

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

“无”中生有：基于知识增强的RAG优化实践

AI开源框架：让分布式系统调试不再"黑盒"

Paimon 与 Spark 的集成（二）：查询优化

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

AI 辅助编程的效果衡量

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

vLLM部署Yuan2.0：高吞吐、更便捷