官方博客-第8页-阿里云开发者社区

ModelScope

2024-05-15

1330

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,330

右予故黎

2024-11-21

1238

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

1,238

ant-ray项目组

2025-04-11

1452

AI开源框架：让分布式系统调试不再"黑盒"

Ray是一个开源分布式计算框架，专为支持可扩展的人工智能（AI）和Python应用程序而设计。它通过提供简单直观的API简化分布式计算，使得开发者能够高效编写并行和分布式应用程序。Ray广泛应用于深度学习训练、大规模推理服务、强化学习以及AI数据处理等场景，并构建了丰富而成熟的技术生态。

ant-ray项目组

1,452

阿里云大数据Al技术

2025-07-28

1751

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源，拥有卓越的代码和 Agent 能力，在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。

阿里云大数据Al技术

1,751

阿里云云原生

2025-02-25

1331

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,331

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43877

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,877

恭常

2024-09-04

2633

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,633

阿里云开发者

2024-11-29

1335

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阅读这个文章可能的收获：理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

阿里云开发者

1,335

阿里云云原生

2024-05-15

74019

通义灵码技术解析，打造 AI 原生开发新范式

本文第一部分先介绍 AIGC 对软件研发的根本性影响，从宏观上介绍当下的趋势；第二部分将介绍 Copilot 模式，第三部分是未来软件研发 Agent 产品的进展。

阿里云云原生

74,019

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

“无”中生有：基于知识增强的RAG优化实践

AI开源框架：让分布式系统调试不再"黑盒"

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

解锁 DeepSeek 安全接入、稳定运行新路径

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

通义灵码技术解析，打造 AI 原生开发新范式

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

“无”中生有：基于知识增强的RAG优化实践

AI开源框架：让分布式系统调试不再"黑盒"

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

解锁 DeepSeek 安全接入、稳定运行新路径

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

通义灵码技术解析，打造 AI 原生开发新范式