官方博客-第6页-阿里云开发者社区

云服务器ECS

2023-10-17

2271

使用ECS部署并使用Docker

本文介绍如何在云服务ECS实例上，部署并使用Docker。

云服务器ECS

2,271

牧申景穆

2024-09-02

3241

【算法精讲系列】阿里云百炼SFT微调实践分享

本内容为您提供了百炼平台SFT微调的实践案例，帮助您方便并快速借助模型微调定制化您自己的专属模型。

牧申景穆

3,241

望宸

2025-02-28

1128

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,128

米基

2024-05-15

3838

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,838

阿里云云原生

2025-04-15

2048

MCP Server 开发实战 | 大模型无缝对接 Grafana

以 AI 世界的“USB-C”标准接口——MCP（Model Context Protocol）为例，演示如何通过 MCP Server 实现大模型与阿里云 Grafana 服务的无缝对接，让智能交互更加高效、直观。

阿里云云原生

2,048

阿里云存储

2024-05-15

140440

用软硬协同设计下的飞天盘古降低存储系统开销

历经 15 载，如今的飞天盘古系统已迭代至第三代，数千万行代码和 1,000 余项专利，从大规模、到高性能、到高效能的分布式存储系统的演进，更高效地让数据中心成为一台计算机。

阿里云存储

140,440

元丹

2024-05-15

282791

深入浅出LangChain与智能Agent：构建下一代AI助手

LangChain为大型语言模型提供了一种全新的搭建和集成方式，通过这个强大的框架，我们可以将复杂的技术任务简化，让创意和创新更加易于实现。本文从LangChain是什么到LangChain的实际案例到智能体的快速发展做了全面的讲解。

元丹

282,791

砚染

2024-09-03

1597

速成RAG+Agent框架大模型应用搭建

本文侧重于能力总结和实操搭建部分，从大模型应用的多个原子能力实现出发，到最终串联搭建一个RAG+Agent架构的大模型应用。

砚染

1,597

硅步

2024-09-27

856

灵魂拷问-前端的作用--性能优化篇

作者最近在尝试对负责的平台进行性能优化，本文整理了些前端性能优化的一些常见策略。

硅步

856

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

使用ECS部署并使用Docker

【算法精讲系列】阿里云百炼SFT微调实践分享

大模型推理主战场：通信协议的标配

大模型推理优化实践：KV cache复用与投机采样

MCP Server 开发实战 | 大模型无缝对接 Grafana

用软硬协同设计下的飞天盘古降低存储系统开销

深入浅出LangChain与智能Agent：构建下一代AI助手

速成RAG+Agent框架大模型应用搭建

灵魂拷问-前端的作用--性能优化篇

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

使用ECS部署并使用Docker

【算法精讲系列】阿里云百炼SFT微调实践分享

大模型推理主战场：通信协议的标配

大模型推理优化实践：KV cache复用与投机采样

MCP Server 开发实战 | 大模型无缝对接 Grafana

用软硬协同设计下的飞天盘古降低存储系统开销

深入浅出LangChain与智能Agent：构建下一代AI助手

速成RAG+Agent框架大模型应用搭建

灵魂拷问-前端的作用--性能优化篇