官方博客-第9页-阿里云开发者社区

ModelScope

2024-05-15

1321

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,321

恭常

2024-09-04

2619

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,619

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43869

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,869

阿里云云原生

2024-05-15

74010

通义灵码技术解析，打造 AI 原生开发新范式

本文第一部分先介绍 AIGC 对软件研发的根本性影响，从宏观上介绍当下的趋势；第二部分将介绍 Copilot 模式，第三部分是未来软件研发 Agent 产品的进展。

阿里云云原生

74,010

阿里云开发者

2024-11-29

1329

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阅读这个文章可能的收获：理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

阿里云开发者

1,329

阿里云云原生

2025-06-03

1270

实现企业级 MCP 服务统一管理和智能检索的实践

本文将深入剖析 MCP Server 的五种主流架构模式，并结合 Nacos 服务治理框架，为企业级 MCP 部署提供实用指南。

阿里云云原生

1,270

阿里云大数据Al技术

2025-07-18

1071

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

阿里云人工智能平台 PAI 提供了完整的模型微调产品能力，支持监督微调（SFT）、偏好对齐（DPO）、强化学习微调（GRPO) 等业界常用模型微调训练方式。根据客户需求及代码能力层级，分别提供了 PAI-Model Gallery 一键微调、PAI-DSW Notebook 编程微调、PAI-DLC 容器化任务微调的全套产品功能。

阿里云大数据Al技术

1,071

德灵

2024-05-15

118206

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,206

阿里云实时数仓Hologres

2024-06-27

3131

实时数仓Hologres OLAP场景核心能力介绍

Hologres提供统一、实时、弹性、易用的一站式实时数仓引擎，解决复杂OLAP难题。

阿里云实时数仓Hologres

3,131

官方博客-第9页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

通义灵码技术解析，打造 AI 原生开发新范式

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

实现企业级 MCP 服务统一管理和智能检索的实践

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

阿里云PAI大模型RAG对话系统最佳实践

实时数仓Hologres OLAP场景核心能力介绍

官方博客-第9页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

通义灵码技术解析，打造 AI 原生开发新范式

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

实现企业级 MCP 服务统一管理和智能检索的实践

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

阿里云PAI大模型RAG对话系统最佳实践

实时数仓Hologres OLAP场景核心能力介绍