官方博客-第8页-阿里云开发者社区

ModelScope

2024-05-15

1374

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,374

ModelScope

2024-05-15

2835

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,835

砚染

2024-09-03

1804

速成RAG+Agent框架大模型应用搭建

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用。

砚染

1,804

赵世振

2024-07-30

2099

阿里云百炼应用实践系列-AI助手快速搭建

本文主要介绍如何基于阿里云百炼平台快速在10分钟为您的网站添加一个 AI 助手。我们基于阿里云百炼平台的能力，以官方帮助文档为参考，搭建了一个以便全天候（7x24）回应客户咨询的AI助手，介绍了相关技术方案和主要代码，供开发者参考。

赵世振

2,099

ant-ray项目组

2025-04-11

1435

AI开源框架：让分布式系统调试不再"黑盒"

Ray是一个开源分布式计算框架，专为支持可扩展的人工智能（AI）和Python应用程序而设计。它通过提供简单直观的API简化分布式计算，使得开发者能够高效编写并行和分布式应用程序。Ray广泛应用于深度学习训练、大规模推理服务、强化学习以及AI数据处理等场景，并构建了丰富而成熟的技术生态。

ant-ray项目组

1,435

ModelScope

2024-05-15

1320

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,320

探索云世界

2025-11-17

245

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开，逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第八篇，MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破。注：客户背景为东南亚头部科技集团，文中用 GoTerra 表示。

探索云世界

245

恭常

2024-09-04

2618

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,618

阿里云开发者

2024-11-29

1329

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阅读这个文章可能的收获：理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

阿里云开发者

1,329

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

元象大模型开源30款量化版本加速低成本部署丨附教程

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

速成RAG+Agent框架大模型应用搭建

阿里云百炼应用实践系列-AI助手快速搭建

AI开源框架：让分布式系统调试不再"黑盒"

vLLM部署Yuan2.0：高吞吐、更便捷

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

元象大模型开源30款量化版本 加速低成本部署丨附教程

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

速成RAG+Agent框架大模型应用搭建

阿里云百炼应用实践系列-AI助手快速搭建

AI开源框架：让分布式系统调试不再"黑盒"

vLLM部署Yuan2.0：高吞吐、更便捷

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

元象大模型开源30款量化版本加速低成本部署丨附教程