官方博客-第24页-阿里云开发者社区

望雲十雨言澈

2025-04-10

568

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

568

田双坤禹杨杨孙健翔

2024-05-15

101797

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

田双坤禹杨杨孙健翔等

101,797

孟威

2024-05-15

105546

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

105,546

斜阳

2024-05-15

133400

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

133,400

隆基

2024-05-15

88951

RocketMQ 流存储解析：面向流场景的关键特性与典型案例

隆基

88,951

ModelScope

2024-05-15

521

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

521

CloudImagine

2024-07-05

403

泛娱乐出海Plus时代，音视频能力基座与时俱进

泛娱乐的音视频技术随着出海在演进，交互和内容的技术是内核，也在融合。

CloudImagine

403

虎仔

2024-10-22

1196

最佳实践：通义灵码生成单元测试，让单测更简单

本文首先讲述了什么是单元测试、单元测试的价值、一个好的单元测试所具备的原则，进而引入如何去编写一个好的单元测试，通义灵码是如何快速生成单元测试的。

虎仔

1,196

李泽政

2024-11-01

820

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

本文中，阿里云智能集团开发工程师李泽政以 Alinux 为操作环境，讲解模块相比传统头文件有哪些优势，并通过若干个例子，学习如何组织一个 C++ 模块工程并使用模块封装第三方库或是改造现有的项目。

李泽政

820

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

AI Infra之模型显存管理分析

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

SLS 大模型可观测&安全推理审计标准解决方案

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

RocketMQ 流存储解析：面向流场景的关键特性与典型案例

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

泛娱乐出海Plus时代，音视频能力基座与时俱进

最佳实践：通义灵码生成单元测试，让单测更简单

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

AI Infra之模型显存管理分析

阿里云 ACK One Serverless Argo 助力深势科技构建高效任务平台

SLS 大模型可观测&安全推理审计标准解决方案

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

RocketMQ 流存储解析：面向流场景的关键特性与典型案例

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

泛娱乐出海Plus时代，音视频能力基座与时俱进

最佳实践：通义灵码生成单元测试，让单测更简单

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐