官方博客-第21页-阿里云开发者社区

亦达

2025-02-20

638

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

638

阿里云云原生

2025-05-16

552

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

为了展现 LoongCollector 的卓越性能，本文通过纵向（LoongCollector 与 iLogtail 产品升级对比）和横向（LoongCollector 与其他开源日志采集 Agent 对比）两方面对比，深度测评不同采集 Agent 在常见的日志采集场景下的性能。

阿里云云原生

552

阿里云PolarDB

2023-08-22

3579

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

本文将介绍PolarDB-X对于向量化SIMD指令的探索和实践，包括基本用法及实现原理，以及在具体算子实现中的思考和沉淀。

阿里云PolarDB

3,579

致问

2023-09-15

119974

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

119,974

岱泽

2024-05-15

76508

总结｜性能优化思路及常用工具及手段

性能优化是降低成本的手段之一，每年大促前业务平台都会组织核心链路上的应用做性能优化，一方面提升系统性能，另外一方面对腐化的代码进行清理。本文结合业务平台性能优化的经验，探讨一下性能优化的思路及常用工具及手段。

岱泽

76,508

ModelScope

2024-05-15

109925

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

109,925

ModelScope

2024-05-15

738

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

Mistral AI在3月24日突然发布并开源了 Mistral 7B v0.2模型，有如下几个特点

ModelScope

738

ModelScope

2024-05-15

1127

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,127

青风义泊牧思

2024-09-03

774

面向OpenTelemetry的Golang应用无侵入插桩技术

文章主要讲述了阿里云 ARMS 团队与程序语言与编译器团队合作研发的面向OpenTelemetry的Golang应用无侵入插桩技术解决方案，旨在解决Golang应用监控的挑战。

青风义泊牧思等

774

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

总结｜性能优化思路及常用工具及手段

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

元象大模型开源30款量化版本加速低成本部署丨附教程

面向OpenTelemetry的Golang应用无侵入插桩技术

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

深度优化 | PolarDB-X 基于向量化SIMD指令的探索

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

总结｜性能优化思路及常用工具及手段

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

元象大模型开源30款量化版本 加速低成本部署丨附教程

面向OpenTelemetry的Golang应用无侵入插桩技术

元象大模型开源30款量化版本加速低成本部署丨附教程