官方博客-第18页-阿里云开发者社区

ModelScope

2024-05-15

1141

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,141

阿里云大数据Al技术

2024-08-09

9131

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

9,131

穿杨

2024-08-21

422

谈谈优雅的钩子--bpftrace

bpftrace是一个内核跟踪工具，简单来说就是在函数上挂个钩子，挂上钩子后就可以将函数的入参和返回值取出来再放入程序进行二次编程，最终能让程序按照我们的意图来对函数进行观测。

穿杨

422

青风义泊牧思

2024-09-03

856

面向OpenTelemetry的Golang应用无侵入插桩技术

文章主要讲述了阿里云 ARMS 团队与程序语言与编译器团队合作研发的面向OpenTelemetry的Golang应用无侵入插桩技术解决方案，旨在解决Golang应用监控的挑战。

青风义泊牧思等

856

贾缃

2024-09-04

502

WASM性能分析-插桩方案

本文结合了代码插桩和性能火焰图的技术，以 WebAssembly 为例介绍了性能分析的方法和相关实现。

贾缃

502

龙蜥社区OpenAnolis

2024-11-06

760

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

760

逸陵

2024-11-18

1009

在当今数字化转型加速的时代，企业 IT 系统的复杂度与日俱增，如何高效地管理和监控这些系统成为了一项挑战。阿里云作为全球领先的云计算服务商，提供了一整套全面的可观测性解决方案，覆盖从业务、端侧（小程序、APP、H5 等）、应用、中间件、容器/ECS 等全栈的监控体系，旨在帮助企业构建强大而灵活的可观测性体系。其中，标签（Tag）作为一种核心组织和管理手段，在阿里云可观测体系中扮演着至关重要的角色。本文将深入探讨阿里云可观测系列产品中标签的应用，以及如何运用标签在阿里云可观测产品体系下进行体系化建设并给出相关最佳实践。

逸陵

1,009

新念

2025-02-14

1444

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,444

亦达

2025-02-20

729

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

729

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

基于RAG搭建企业级知识库在线问答

谈谈优雅的钩子--bpftrace

面向OpenTelemetry的Golang应用无侵入插桩技术

WASM性能分析-插桩方案

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

一文详解阿里云可观测体系下标签最佳实践

DeepSeek-V3 高效训练关键技术分析

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LISA微调技术解析：比LoRA更低的显存更快的速度

基于RAG搭建企业级知识库在线问答

谈谈优雅的钩子--bpftrace

面向OpenTelemetry的Golang应用无侵入插桩技术

WASM性能分析-插桩方案

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

一文详解阿里云可观测体系下标签最佳实践

DeepSeek-V3 高效训练关键技术分析

破解 vLLM + DeepSeek 规模化部署的“不可能三角”