官方博客-第15页-阿里云开发者社区

斜阳

2024-05-15

133382

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

133,382

阿里云云原生

2024-05-15

79762

让研发规范管得住，在流水线之上做研发流程

研发规范的目标，是为了解决或降低出现软件危机的风险。但传统流水线受限于工具的定位，无法解决研发规范的落地问题，需要在更高的层面来解决。阿里云云效团队经过内部启发后推出的新产品：云效应用交付平台 AppStack 给出了解决方案，快来使用体验吧！

阿里云云原生

79,762

ModelScope

2024-05-15

725

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

725

牛俊

2024-08-15

11742

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,742

飒爽

2024-09-04

541

用Prompt技巧激发无限创意

本文深入探讨当前最前沿的prompt engineering方案，结合OpenAI、Anthropic和Google等大模型公司的资料，以及开源社区中宝贵的prompt技巧分享，全面解析这一领域的实践策略。

飒爽

541

裘展

2024-11-07

1652

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,652

亦达

2025-02-20

701

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

701

望雲十雨言澈

2025-04-10

534

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

534

致问

2023-09-15

120019

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

120,019

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

让研发规范管得住，在流水线之上做研发流程

联合XTuner，魔搭社区全面支持数据集的长文本训练

动手实践：高效构建企业级AI搜索

用Prompt技巧激发无限创意

白话文讲解大模型｜ Attention is all you need

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI Infra之模型显存管理分析

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

让研发规范管得住，在流水线之上做研发流程

联合XTuner，魔搭社区全面支持数据集的长文本训练

动手实践：高效构建企业级AI搜索

用Prompt技巧激发无限创意

白话文讲解大模型｜ Attention is all you need

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI Infra之模型显存管理分析

Hologres RoaringBitmap实践，千亿级画像数据秒级分析