官方博客-第8页-阿里云开发者社区

望宸

2025-02-28

1289

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,289

是溪诚全南也

2025-02-28

1023

1分钟集成DeepSeek满血版！搭建智能运维助手

阿里云 AI 搜索开放平台面向企业及开发者提供丰富的组件化AI搜索服务，本文将重点介绍基于AI搜索开放平台内置的 DeepSeek-R1 系列大模型，如何搭建 Elasticsearch AI Assistant。

是溪诚全南也等

1,023

阿里云云原生

2025-02-25

1326

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,326

橙唯

2025-02-21

1000

基于LLM打造沉浸式3D世界

阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索，为了解决LLMs与3D结合的问题，近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案，通过自然语言来与引擎内的3D世界进行交互。

橙唯

1,000

阿里云开发者

2025-02-20

1045

在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

如何在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

阿里云开发者

1,045

亦达

2025-02-20

800

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

800

望宸

2025-02-20

872

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

872

阿里云云原生

2025-02-19

549

一键构建智能导购 AI 助手，轻松重塑购物体验

在数字化时代，线上购物已成为消费者生活中不可或缺的消费方式，而消费者的购物习惯和需求逐渐呈现多样化的趋势，为了帮助商家全天候、自动化地满足顾客的购物需求，本方案将详细介绍如何基于商品内容构建一个智能商品导购助手。

阿里云云原生

549

新念

2025-02-14

1570

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,570

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

大模型推理主战场：通信协议的标配

1分钟集成DeepSeek满血版！搭建智能运维助手

解锁 DeepSeek 安全接入、稳定运行新路径

基于LLM打造沉浸式3D世界

在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

大模型推理服务全景图

一键构建智能导购 AI 助手，轻松重塑购物体验

DeepSeek-V3 高效训练关键技术分析

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理主战场：通信协议的标配

1分钟集成DeepSeek满血版！搭建智能运维助手

解锁 DeepSeek 安全接入、稳定运行新路径

基于LLM打造沉浸式3D世界

在IDE里使用DeepSeek-V3 和 DeepSeek-R1 满血版模型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

大模型推理服务全景图

一键构建智能导购 AI 助手，轻松重塑购物体验

DeepSeek-V3 高效训练关键技术分析