官方博客-第15页-阿里云开发者社区

羽沐

2024-12-13

1947

动态链接的魔法：Linux下动态链接库机制探讨

本文将深入探讨Linux系统中的动态链接库机制，这其中包括但不限于全局符号介入、延迟绑定以及地址无关代码等内容。

羽沐

1,947

望宸

2025-02-28

1057

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,057

丕天

2025-03-21

1100

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,100

剑洁雲尧

2024-09-04

607

浅谈Elasticsearch的入门与实践

本文主要围绕ES核心特性：分布式存储特性和分析检索能力，介绍了概念、原理与实践案例，希望让读者快速理解ES的核心特性与应用场景。

剑洁雲尧

607

舟谨

2024-11-29

2019

作为开发者，我如何提高任务型大模型应用的响应性能

本文基于实际场景，分享了作为开发者提高大模型响应性能的四个实用方法。

舟谨

2,019

望宸

2025-02-07

751

浏览量超 10w 的热图，描述 RAG 的主流架构

大模型性能的持续提升，进一步挖掘了 RAG 的潜力，RAG 将检索系统与生成模型相结合，带来诸多优势，如实时更新知识、降低成本等。点击本文，为您梳理 RAG 的基本信息，并介绍提升大模型生成结果的方法，快一起看看吧~

望宸

751

子白

2024-05-15

102426

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,426

ModelScope

2024-05-15

2567

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,567

阿里云存储

2024-07-16

20449

几百T的视频、图片数据进行更有效地存储和管理

采用传统硬盘搭建存储方案，看起来成本低廉，但是再加上各种附加因素后却大幅攀升，而云存储厂商通常提供基于订阅的定价模型、一些免费服务和一定的折扣。现在，我们就来了解一下如何更省钱地使用云存储。

阿里云存储

20,449

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

动态链接的魔法：Linux下动态链接库机制探讨

大模型推理主战场：通信协议的标配

AI 推理场景的痛点和解决方案

浅谈Elasticsearch的入门与实践

作为开发者，我如何提高任务型大模型应用的响应性能

浏览量超 10w 的热图，描述 RAG 的主流架构

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

几百T的视频、图片数据进行更有效地存储和管理

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

动态链接的魔法：Linux下动态链接库机制探讨

大模型推理主战场：通信协议的标配

AI 推理场景的痛点和解决方案

浅谈Elasticsearch的入门与实践

作为开发者，我如何提高任务型大模型应用的响应性能

浏览量超 10w 的热图，描述 RAG 的主流架构

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

几百T的视频、图片数据进行更有效地存储和管理