官方博客-第15页-阿里云开发者社区

亦达

2025-02-20

746

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

746

章磊

2023-08-15

22972

迄今为止最完整的DDD实践

对于一个架构师来说，在软件开发中如何降低系统复杂度是一个永恒的挑战。

章磊

22,972

浅奕

2024-09-24

594

通过实验深入了解 TCP 数据的发送和接收

本系列文章是组内写给新人和实习生的 TCP入门系列教程，结合了理论和实践，本篇为第二篇，建议先读上篇《通过实验深入了解TCP 连接的建立和关闭》。

浅奕

594

赵世振

2024-08-22

1256

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

在阿里云平台上，您只需十分钟，无需任何编码，即可在企业微信上为您的组织集成一个具备大模型能力的AI助手。此助手可24小时响应用户咨询，解答各类问题，尤其擅长处理私域问题，从而成为您企业的专属助手，有效提升用户体验及业务竞争力。

赵世振

1,256

才胜南也

2024-09-05

1003

RAG效果优化：高质量文档解析详解

本文关于如何将非结构化数据（如PDF和Word文档）转换为结构化数据，以便于RAG（Retrieval-Augmented Generation）系统使用。

才胜南也

1,003

裘展

2024-11-07

1697

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,697

羿莉

2024-12-17

1633

云上数据安全保护：敏感日志扫描与脱敏实践详解

随着企业对云服务的广泛应用，数据安全成为重要课题。通过对云上数据进行敏感数据扫描和保护，可以有效提升企业或组织的数据安全。本文主要基于阿里云的数据安全中心数据识别功能进行深入实践探索。通过对商品购买日志的模拟，分析了如何使用阿里云的工具对日志数据进行识别、脱敏（3 种模式）处理和基于 StoreView 的查询脱敏方式，从而在保障数据安全的同时满足业务需求。通过这些实践，企业可以有效降低数据泄漏风险，提升数据治理能力和系统安全性。

羿莉

1,633

张智超

2025-02-07

483

巧用通义灵码，提升前端研发效率

本次分享，主题是利用通义灵码提升前端研发效率。分享内容主要包括以下几部分：首先，我将从前端开发的角度介绍对通义灵码的基本认识；其次，我将展示通义灵码在日常研发中的应用案例；然后，我将通过实例说明，良好的设计能够显著提升通义灵码的效果。在第四个部分，我将介绍通义灵码的企业知识库以及如何利用 RAG 构建团队智能研发助手。最后，我将总结本次分享并展望未来方向。

张智超

483

柯灵

2025-03-11

1601

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,601

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

迄今为止最完整的DDD实践

通过实验深入了解 TCP 数据的发送和接收

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

RAG效果优化：高质量文档解析详解

白话文讲解大模型｜ Attention is all you need

云上数据安全保护：敏感日志扫描与脱敏实践详解

巧用通义灵码，提升前端研发效率

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

迄今为止最完整的DDD实践

通过实验深入了解 TCP 数据的发送和接收

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

RAG效果优化：高质量文档解析详解

白话文讲解大模型｜ Attention is all you need

云上数据安全保护：敏感日志扫描与脱敏实践详解

巧用通义灵码，提升前端研发效率

QwQ-32B一键部署，真正的0代码，0脚本，0门槛