官方博客-第26页-阿里云开发者社区

ModelScope

2024-05-15

716

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

716

资源编排ROS

2024-06-04

1165

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

ChatTTS是一款针对对话场景的文本转语音模型，支持英中两种语言，训练数据超过10万小时。ChatTTS可通过WebUI和API访问。阿里云的资源编排服务(ROS)提供了一键部署ChatTTS到云端的方案，用户只需在ROS控制台配置模板参数，如区域和实例类型，即可完成部署。部署后，从资源栈输出获取ChatTTS服务地址。ROS利用IaC理念自动化部署云资源和应用，提高了部署效率和稳定性。

资源编排ROS

1,165

穿杨

2024-08-21

385

谈谈优雅的钩子--bpftrace

bpftrace是一个内核跟踪工具，简单来说就是在函数上挂个钩子，挂上钩子后就可以将函数的入参和返回值取出来再放入程序进行二次编程，最终能让程序按照我们的意图来对函数进行观测。

穿杨

385

布谷

2024-09-03

578

React 的正确使用方法：ref 篇

你真的用对了 useRef 吗？在与 TypeScript 一起使用、以及撰写组件库的情况下，你的写法能够避开以下所有场景的坑吗？

布谷

578

重彦

2024-09-25

685

深入探索 RUM 与全链路追踪：优化数字体验的利器

本文主要介绍了基于 OpenTeletemetry 与 W3C 协议构建端到端全链路的解决方案，同时探讨了 RUM 与端到端链路集成的最佳实践，希望可以为大家在生产环境落地应用提供一些参考。

重彦

685

涯海

2025-01-23

941

快速定位并优化CPU 与 JVM 内存性能瓶颈

本文介绍了 Java 应用常见的 CPU & JVM 内存热点原因及优化思路。

涯海

941

言澈

2025-02-28

1159

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,159

尹斌斌周絮

2025-03-21

753

解决隐式内存占用难题

本文详细介绍了在云原生和容器化部署环境中，内存管理和性能优化所面临的挑战及相应的解决方案。

尹斌斌周絮

753

望雲十雨言澈

2025-04-10

527

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

527

官方博客-第26页-阿里云开发者社区

类目筛选

内容类型

联合XTuner，魔搭社区全面支持数据集的长文本训练

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

谈谈优雅的钩子--bpftrace

React 的正确使用方法：ref 篇

深入探索 RUM 与全链路追踪：优化数字体验的利器

快速定位并优化CPU 与 JVM 内存性能瓶颈

进行GPU算力管理

解决隐式内存占用难题

AI Infra之模型显存管理分析

官方博客-第26页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

联合XTuner，魔搭社区全面支持数据集的长文本训练

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

谈谈优雅的钩子--bpftrace

React 的正确使用方法：ref 篇

深入探索 RUM 与全链路追踪：优化数字体验的利器

快速定位并优化CPU 与 JVM 内存性能瓶颈

进行GPU算力管理

解决隐式内存占用难题

AI Infra之模型显存管理分析