官方博客-第17页-阿里云开发者社区

ModelScope

2024-05-15

110028

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,028

赵世振

2024-08-21

1493

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用阿里云百炼平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用阿里云百炼的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

1,493

昱临

2024-11-14

1082

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

笔者结合实践经验以近期在负责的复杂表格智能问答为切入点，结合大模型的哲学三问（“是谁、从哪里来、到哪里去”），穿插阐述自己对大模型的一些理解与判断，以及面向公共云LLM的建设模式思考，并分享软件设计+模型算法结合的一些研发实践经验。

昱临

1,082

寒斜

2024-11-19

787

基于事件驱动构建 AI 原生应用

AI 应用在商业化服务的阶段会面临诸多挑战，比如更快的服务交付速度，更实时、精准的结果以及更人性化的体验等，传统架构限制于同步交互，无法满足上述需求，本篇文章给大家分享一下如何基于事件驱动架构应对上述挑战。

寒斜

787

新念

2025-02-14

1453

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,453

荣阳

2025-02-28

1057

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,057

ModelScope

2024-05-15

968

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

968

ModelScope

2024-05-15

759

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

759

涯海

2025-01-17

700

链路诊断最佳实践：1 分钟定位错慢根因

本文聚焦于线上应用的风险管理，特别是针对“错”（程序运行不符合预期）和“慢”（性能低下或响应迟缓）两大类问题，提出了一个系统化的根因诊断方案。

涯海

700

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

基于事件驱动构建 AI 原生应用

DeepSeek-V3 高效训练关键技术分析

使用A10单卡24G复现DeepSeek R1强化学习过程

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

联合XTuner，魔搭社区全面支持数据集的长文本训练

链路诊断最佳实践：1 分钟定位错慢根因

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性 思考到实践经验总结

基于事件驱动构建 AI 原生应用

DeepSeek-V3 高效训练关键技术分析

使用A10单卡24G复现DeepSeek R1强化学习过程

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

联合XTuner，魔搭社区全面支持数据集的长文本训练

链路诊断最佳实践：1 分钟定位错慢根因

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结