官方博客-第26页-阿里云开发者社区

亦达

2025-02-20

801

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

801

笃敏

2025-03-28

288

架构革新：揭示卓越性能与高可扩展的共赢秘诀

为了构建现代化的可观测数据采集器LoongCollector，iLogtail启动架构通用化升级，旨在提供高可靠、高可扩展和高性能的实时数据采集和计算服务。然而，通用化的过程总会伴随性能劣化，本文重点介绍LoongCollector的性能优化之路，并对通用化和高性能之间的平衡给出见解。

笃敏

288

屈岳

2023-12-01

62693

SLS支持高精度时间戳和全局排序

日志内容本身是一种重要信息，日志之间的相对顺序也是因果关系的一种反映，某些场景下如果日志内容完全相同，但是日志间的顺序错乱了反映出来的结果可能和真实世界里面的事件完全相反。

屈岳

62,693

ModelScope

2024-05-15

662

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

本文将以Yuan2.0最新发布的Februa模型为例进行测试验证，用更小规模的模型达到更好的效果。

ModelScope

662

浅奕

2024-09-05

454

通过实验深入了解 TCP 连接的建立和关闭

TCP/IP 这个主题很多文章比较陈旧，且以讹传讹的东西太多，所以本文作者结合了理论和实践去写，旨在通过一系列实验帮助读者深入理解 TCP 连接的建立过程。

浅奕

454

阿里云云原生

2024-09-14

559

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

本⽂对敏感信息拦截插件的使用方式和实现原理进行了简单介绍，它能够自动检测并处理请求和响应中的敏感词，有效防止敏感信息泄露。通过对不同数据范围的支持和灵活的配置选项，该插件能够适应各种应用场景，确保数据的安全性和合规性。

阿里云云原生

559

阿里云云原生

2024-11-06

630

比 Copilot 快两倍以上，在我的开源项目 AI Godot 桌宠中用通义灵码解决问题

在我的开源项目 AI Godot 桌宠中用通义灵码解决问题。

阿里云云原生

630

昔今

2024-12-10

812

两招玩转阿里云系统事件监控

两招玩转阿里云系统事件监控，教你如何快速使用云监控监控阿里云重要系统事件。

昔今

812

柯灵

2025-03-11

1656

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,656

官方博客-第26页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

架构革新：揭示卓越性能与高可扩展的共赢秘诀

SLS支持高精度时间戳和全局排序

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

通过实验深入了解 TCP 连接的建立和关闭

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

比 Copilot 快两倍以上，在我的开源项目 AI Godot 桌宠中用通义灵码解决问题

两招玩转阿里云系统事件监控

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

官方博客-第26页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

架构革新：揭示卓越性能与高可扩展的共赢秘诀

SLS支持高精度时间戳和全局排序

Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术

通过实验深入了解 TCP 连接的建立和关闭

用 Rust 实现敏感信息拦截插件，提升 AI 网关安全防护能力

比 Copilot 快两倍以上，在我的开源项目 AI Godot 桌宠中用通义灵码解决问题

两招玩转阿里云系统事件监控

QwQ-32B一键部署，真正的0代码，0脚本，0门槛