官方博客-第11页-阿里云开发者社区

亦达

2025-02-20

708

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

708

望宸

2025-02-20

645

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

645

阿里云云原生

2025-02-19

475

一键构建智能导购 AI 助手，轻松重塑购物体验

在数字化时代，线上购物已成为消费者生活中不可或缺的消费方式，而消费者的购物习惯和需求逐渐呈现多样化的趋势，为了帮助商家全天候、自动化地满足顾客的购物需求，本方案将详细介绍如何基于商品内容构建一个智能商品导购助手。

阿里云云原生

475

新念

2025-02-14

1425

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,425

房俊

2025-02-13

4019

大模型意图识别工程化实践

本文重点介绍大模型意图识别能力在智能电视核心链路中的落地过程和思考，对比了基础模型、RAG 、以及7b模型微调三种方案的优缺点。

房俊

4,019

阿里云云原生

2025-02-13

4365

在通义灵码里用上DeepSeek-V3 和 DeepSeek-R1 满血版671B模型

除了 AI 程序员的重磅上线外，近期通义灵码能力再升级全新上线模型选择功能，目前已经支持 Qwen2.5、DeepSeek-V3 和 R1系列模型，用户可以在 VSCode 和 JetBrains 里搜索并下载最新通义灵码插件，在输入框里选择模型，即可轻松切换模型。

阿里云云原生

4,365

肯梦筱姜

2025-02-11

661

0 代码！2 种方式，一键部署 DeepSeek 系列模型

DeepSeek 凭借其卓越的性能和广泛的应用场景，迅速在全球范围内获得了极高的关注度和广泛的用户基础。DeepSeek-R1-Distill 是使用 DeepSeek-R1 生成的样本对开源模型进行蒸馏得到的小模型，拥有更小参数规模，推理成本更低，基准测试同样表现出色。依托于函数计算 FC 算力，Serverless+ AI 开发平台 CAP 现已提供模型服务、应用模版两种部署方式辅助您部署 DeepSeek R1 系列模型。完成模型部署后，您即可与模型进行对话体验；或以 API 形式进行调用，接入 AI 应用中。欢迎您立即体验。

肯梦筱姜

661

张智超

2025-02-07

452

巧用通义灵码，提升前端研发效率

本次分享，主题是利用通义灵码提升前端研发效率。分享内容主要包括以下几部分：首先，我将从前端开发的角度介绍对通义灵码的基本认识；其次，我将展示通义灵码在日常研发中的应用案例；然后，我将通过实例说明，良好的设计能够显著提升通义灵码的效果。在第四个部分，我将介绍通义灵码的企业知识库以及如何利用 RAG 构建团队智能研发助手。最后，我将总结本次分享并展望未来方向。

张智超

452

叶枫

2025-02-06

475

详解智能编码在前端研发的创新应用

接下来，人与智能体的交互将变得更为紧密，比如 N 年以后是否可以逐渐过渡。这个逐渐过渡的过程实际上是温和的，从依赖人类到依赖超大规模算力的转变，可能会取代我们的一些职责。这不仅仅是简单的叠加关系。对于AI和超大规模算力，这是否意味着我们可以大幅度提升软件质量，是否可以缩短研发周期并提高效率，还有创造出更优质的软件并持续发展，这无疑是肯定的。

叶枫

475

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

大模型推理服务全景图

一键构建智能导购 AI 助手，轻松重塑购物体验

DeepSeek-V3 高效训练关键技术分析

大模型意图识别工程化实践

在通义灵码里用上DeepSeek-V3 和 DeepSeek-R1 满血版671B模型

0 代码！2 种方式，一键部署 DeepSeek 系列模型

巧用通义灵码，提升前端研发效率

详解智能编码在前端研发的创新应用

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

大模型推理服务全景图

一键构建智能导购 AI 助手，轻松重塑购物体验

DeepSeek-V3 高效训练关键技术分析

大模型意图识别工程化实践

在通义灵码里用上DeepSeek-V3 和 DeepSeek-R1 满血版671B模型

0 代码！2 种方式，一键部署 DeepSeek 系列模型

巧用通义灵码，提升前端研发效率

详解智能编码在前端研发的创新应用