官方博客-第21页-阿里云开发者社区

亦达

2025-02-20

729

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

729

阿里云云原生

2025-08-06

407

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南

JSON 日志因灵活易扩展而广泛应用，但其海量数据也带来分析挑战。本文系统介绍阿里云日志服务（SLS）中处理 JSON 日志的最佳实践，涵盖数据预处理、索引配置、JSON 函数使用及 SQL 智能生成，助你高效挖掘日志价值。

阿里云云原生

407

斜阳

2024-05-15

133400

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

133,400

阿里云云原生

2024-05-15

44123

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

在本文中，作者探讨了ZooKeeper（ZK）的一个内存占用问题，特别是当有大量的Watcher和ZNode时，导致的内存消耗。

阿里云云原生

44,123

豁朗

2024-05-15

634

通过日志服务实现数据库MySQL入湖OSS实践

本文为您介绍如何使用日志服务来实现MySQL数据库入湖OSS。

豁朗

634

ModelScope

2024-05-15

1141

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,141

钰诚

2024-08-12

567

使用 Higress 快速构建 AI 应用

Higress 基于企业内外的丰富场景沉淀了众多面向 AI 的功能，推出了 AI 原生的 API 网关形态并且全部开源。

钰诚

567

虎仔

2024-10-22

1196

最佳实践：通义灵码生成单元测试，让单测更简单

本文首先讲述了什么是单元测试、单元测试的价值、一个好的单元测试所具备的原则，进而引入如何去编写一个好的单元测试，通义灵码是如何快速生成单元测试的。

虎仔

1,196

李泽政

2024-11-01

820

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

本文中，阿里云智能集团开发工程师李泽政以 Alinux 为操作环境，讲解模块相比传统头文件有哪些优势，并通过若干个例子，学习如何组织一个 C++ 模块工程并使用模块封装第三方库或是改造现有的项目。

李泽政

820

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

通过日志服务实现数据库MySQL入湖OSS实践

LISA微调技术解析：比LoRA更低的显存更快的速度

使用 Higress 快速构建 AI 应用

最佳实践：通义灵码生成单元测试，让单测更简单

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

JSON 日志分析的“正确姿势”：阿里云 SLS 高效实践指南

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

通过日志服务实现数据库MySQL入湖OSS实践

LISA微调技术解析：比LoRA更低的显存更快的速度

使用 Higress 快速构建 AI 应用

最佳实践：通义灵码生成单元测试，让单测更简单

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐