官方博客-第14页-阿里云开发者社区

新念

2025-02-14

1448

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,448

言澈

2025-02-28

1195

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,195

望宸魁宇

2025-04-07

427

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

是否还记得 2022 年 K8s Ingress Nginx 披露了的 3 个高危安全漏洞（CVE-2021-25745, CVE-2021-25746, CVE-2021-25748），并在那一年宣布停止接收新功能 PR，专注修复并提升稳定性。

望宸魁宇

427

宗衡

2025-07-10

742

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

本文记录了一次从灵光一现到快速落地的 AI + 地图服务实践，通过结合 Cursor 与高德 MCP 地图服务平台，作者仅用几个小时就实现了一个可交互、可筛选、可推荐的杭州美食地图应用。

宗衡

742

ModelScope

2024-05-15

110021

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,021

ModelScope

2024-05-15

1168

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,168

阿里云云原生

2024-05-15

44124

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

在本文中，作者探讨了ZooKeeper（ZK）的一个内存占用问题，特别是当有大量的Watcher和ZNode时，导致的内存消耗。

阿里云云原生

44,124

青风义泊牧思

2024-09-03

856

面向OpenTelemetry的Golang应用无侵入插桩技术

文章主要讲述了阿里云 ARMS 团队与程序语言与编译器团队合作研发的面向OpenTelemetry的Golang应用无侵入插桩技术解决方案，旨在解决Golang应用监控的挑战。

青风义泊牧思等

856

赵世振

2025-01-09

2078

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

本文章旨在帮助读者了解并掌握大模型多模态技术的实际应用，特别是如何构建基于多模态的实用场景。文档通过几个具体的多模态应用场景，如拍立淘、探一下和诗歌相机，展示了这些技术在日常生活中的应用潜力。

赵世振

2,078

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

进行GPU算力管理

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

vLLM部署Yuan2.0：高吞吐、更便捷

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

面向OpenTelemetry的Golang应用无侵入插桩技术

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

进行GPU算力管理

IngressNightmare：Ingress Nginx 再曝5个安全漏洞，可接管你的 K8s 集群

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

vLLM部署Yuan2.0：高吞吐、更便捷

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

面向OpenTelemetry的Golang应用无侵入插桩技术

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发