ModelScope

2024-05-15

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

108,941

阿里云云原生

2024-05-15

43404

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

在本文中，作者探讨了ZooKeeper（ZK）的一个内存占用问题，特别是当有大量的Watcher和ZNode时，导致的内存消耗。

阿里云云原生

43,404

阿里云大数据Al技术

2024-08-09

8172

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

8,172

问思望宸

2024-08-12

7708

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

本文分享了作为一款全能型网关【云原生 API 网关】是如何帮助企业落地统一网关架构的。

问思望宸

7,708

赵世振

2024-08-22

224

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

在阿里云平台上，您只需十分钟，无需任何编码，即可在企业微信上为您的组织集成一个具备大模型能力的AI助手。此助手可24小时响应用户咨询，解答各类问题，尤其擅长处理私域问题，从而成为您企业的专属助手，有效提升用户体验及业务竞争力。

赵世振

224

吴昆

2024-05-15

145568

弹性调度助力企业灵活应对业务变化，高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化，并高效管理云上资源。

吴昆

145,568

王骜

2024-05-15

164948

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

164,948

豁朗

2024-05-15

312

用SLS配置日志关键字告警的N种方法

本文由日志关键词告警出发，介绍了使用SLS进行关键词监控告警配置，并且介绍了几种常见的配置方法，可以覆盖关键词监控的大部分场景。

豁朗

312

ModelScope

2024-05-15

205

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

205

类目筛选

内容类型

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

基于RAG搭建企业级知识库在线问答

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

弹性调度助力企业灵活应对业务变化，高效管理云上资源

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

用SLS配置日志关键字告警的N种方法

联合XTuner，魔搭社区全面支持数据集的长文本训练