官方博客-第17页-阿里云开发者社区

新念

2025-02-14

1444

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,444

亦达

2025-02-20

729

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

729

望雲十雨言澈

2025-04-10

568

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

568

杨永

2024-05-15

93884

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

93,884

阿里云实时数仓Hologres

2024-06-18

2327

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

2,327

剑洁雲尧

2024-09-04

633

浅谈Elasticsearch的入门与实践

本文主要围绕ES核心特性：分布式存储特性和分析检索能力，介绍了概念、原理与实践案例，希望让读者快速理解ES的核心特性与应用场景。

剑洁雲尧

633

寒斜

2024-10-11

1022

打造你的专属语音助手，基于函数计算托管 CosyVoice 语音模型

今天分享一下，基于阿里云函数计算 FC 以及 CAP（云应用开发平台），极速托管专属的 CosyVoice 应用。并且我们提供了 API 调用方案以及镜像构建源码方便您根据自己的业务任意 DIY。

寒斜

1,022

虎仔

2024-10-22

1196

最佳实践：通义灵码生成单元测试，让单测更简单

本文首先讲述了什么是单元测试、单元测试的价值、一个好的单元测试所具备的原则，进而引入如何去编写一个好的单元测试，通义灵码是如何快速生成单元测试的。

虎仔

1,196

李泽政

2024-11-01

820

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

本文中，阿里云智能集团开发工程师李泽政以 Alinux 为操作环境，讲解模块相比传统头文件有哪些优势，并通过若干个例子，学习如何组织一个 C++ 模块工程并使用模块封装第三方库或是改造现有的项目。

李泽政

820

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI Infra之模型显存管理分析

使用KMS为MSE-Nacos敏感配置加密的最佳实践

森马基于MaxCompute+Hologres+DataWorks构建数据中台

浅谈Elasticsearch的入门与实践

打造你的专属语音助手，基于函数计算托管 CosyVoice 语音模型

最佳实践：通义灵码生成单元测试，让单测更简单

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI Infra之模型显存管理分析

使用KMS为MSE-Nacos敏感配置加密的最佳实践

森马基于MaxCompute+Hologres+DataWorks构建数据中台

浅谈Elasticsearch的入门与实践

打造你的专属语音助手，基于函数计算托管 CosyVoice 语音模型

最佳实践：通义灵码生成单元测试，让单测更简单

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐