官方博客-第21页-阿里云开发者社区

ModelScope

2024-05-15

104664

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

104,664

探索云世界

2024-05-15

1021

阿里妈妈展示广告引擎新探索：迈向全局最优算力分配

在绿色计算的大背景下，算力分配将朝着更加高效和智能的方向持续演进。本文将介绍阿里妈妈展示广告引擎在全局视角下优化算力分配的新探索，让在线引擎像变形金刚一样灵活强悍。算力在提倡节能减排，降本增效，追求绿色技术的大趋势下，充分利用好算力资源，尤其是在阿里妈妈展示广告引擎这种使用近百万core机器资源的业...

探索云世界

1,021

ModelScope

2024-05-15

711

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

711

陈浩章颖强

2024-05-29

55695

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,695

阿里云云原生

2024-07-30

3552

5 大场景上手通义灵码企业知识库问答

通义灵码在企业版里还引入了一个超酷的新技能：RAG（Retrieval-Augmented Generation）检索增强生成的能力，本文就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

3,552

阿里云大数据Al技术

2024-08-09

9091

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

9,091

阿里云云原生

2024-10-18

957

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

957

新念

2025-02-14

1390

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,390

望雲十雨言澈

2025-04-10

520

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

520

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

手把手教你捏一个自己的Agent

阿里妈妈展示广告引擎新探索：迈向全局最优算力分配

联合XTuner，魔搭社区全面支持数据集的长文本训练

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

5 大场景上手通义灵码企业知识库问答

基于RAG搭建企业级知识库在线问答

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

DeepSeek-V3 高效训练关键技术分析

AI Infra之模型显存管理分析

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

手把手教你捏一个自己的Agent

阿里妈妈展示广告引擎新探索：迈向全局最优算力分配

联合XTuner，魔搭社区全面支持数据集的长文本训练

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

5 大场景上手通义灵码企业知识库问答

基于RAG搭建企业级知识库在线问答

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

DeepSeek-V3 高效训练关键技术分析

AI Infra之模型显存管理分析