官方博客-第17页-阿里云开发者社区

勉成

2024-12-20

1547

Redis是如何建立连接和处理命令的

本文主要讲述 Redis 是如何监听客户端发出的set、get等命令的。

勉成

1,547

望宸

2025-02-28

1057

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,057

日休

2025-03-06

1350

一招解决数据库中报表查询慢的痛点

本文旨在解决传统数据库系统如PostgreSQL在处理复杂分析查询时面临的性能瓶颈问题。

日休

1,350

丕天

2025-03-21

1100

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,100

剑洁雲尧

2024-09-04

607

浅谈Elasticsearch的入门与实践

本文主要围绕ES核心特性：分布式存储特性和分析检索能力，介绍了概念、原理与实践案例，希望让读者快速理解ES的核心特性与应用场景。

剑洁雲尧

607

舟谨

2024-11-29

2019

作为开发者，我如何提高任务型大模型应用的响应性能

本文基于实际场景，分享了作为开发者提高大模型响应性能的四个实用方法。

舟谨

2,019

望宸

2025-02-07

751

浏览量超 10w 的热图，描述 RAG 的主流架构

大模型性能的持续提升，进一步挖掘了 RAG 的潜力，RAG 将检索系统与生成模型相结合，带来诸多优势，如实时更新知识、降低成本等。点击本文，为您梳理 RAG 的基本信息，并介绍提升大模型生成结果的方法，快一起看看吧~

望宸

751

探索云世界

2025-08-12

441

「迁移急救包」全云平台无缝迁移云效实操手册

阿里云云效是国内领先的一站式DevOps平台，提供代码全生命周期管理、智能化交付流水线及精细化研发管控，支持多种开发场景。本文详细介绍了从其他平台（如Coding）向云效迁移的完整方案，包括代码仓库、流水线、制品仓库及项目数据的迁移步骤，帮助用户实现高效、安全的平滑迁移，提升研发效率与协作能力。

探索云世界

441

子白

2024-05-15

102426

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,426

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

Redis是如何建立连接和处理命令的

大模型推理主战场：通信协议的标配

一招解决数据库中报表查询慢的痛点

AI 推理场景的痛点和解决方案

浅谈Elasticsearch的入门与实践

作为开发者，我如何提高任务型大模型应用的响应性能

浏览量超 10w 的热图，描述 RAG 的主流架构

「迁移急救包」全云平台无缝迁移云效实操手册

大语言模型推理提速，TensorRT-LLM 高性能推理实践

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Redis是如何建立连接和处理命令的

大模型推理主战场：通信协议的标配

一招解决数据库中报表查询慢的痛点

AI 推理场景的痛点和解决方案

浅谈Elasticsearch的入门与实践

作为开发者，我如何提高任务型大模型应用的响应性能

浏览量超 10w 的热图，描述 RAG 的主流架构

「迁移急救包」全云平台无缝迁移云效实操手册

大语言模型推理提速，TensorRT-LLM 高性能推理实践