官方博客-第13页-阿里云开发者社区

望宸

2025-02-28

1032

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,032

荣阳

2025-02-28

1016

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,016

阿里云云原生

2025-04-17

1184

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

通义灵码新上的外挂 Project Rules 获得了开发者的一致好评：最小成本适配我的开发风格、相当把团队经验沉淀下来，是个很好功能……

阿里云云原生

1,184

阿里云云原生

2025-04-23

859

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

Spring AI Alibaba Graph 的核心开发已完成，即将发布正式版本。开发者可基于此轻松构建工作流、智能体及多智能体系统，功能丰富且灵活。文章通过三个示例展示了其应用：1) 客户评价处理系统，实现两级问题分类与自动处理；2) 基于 ReAct Agent 的天气预报查询系统，循环执行用户指令直至完成；3) 基于 Supervisor 多智能体的 OpenManus 实现，简化了流程控制逻辑并优化了工具覆盖度。此外，还提供了运行示例的方法及未来规划，欢迎开发者参与贡献。

阿里云云原生

859

阿里云开发者

2025-04-24

1113

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,113

子白

2024-05-15

102406

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,406

ModelScope

2024-05-15

1351

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

1,351

ModelScope

2024-05-15

1813

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,813

阿里云云原生

2024-05-15

55681

Higress 全新 Wasm 运行时，性能大幅提升

本文介绍 Higress 将 Wasm 插件的运行时从 V8 切换到 WebAssembly Micro Runtime (WAMR) 的最新进展。

阿里云云原生

55,681

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

大模型推理主战场：通信协议的标配

使用A10单卡24G复现DeepSeek R1强化学习过程

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

为什么一定要做Agent智能体？

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

Multi-Agent实践第7期：智能体的高效协作

Higress 全新 Wasm 运行时，性能大幅提升

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理主战场：通信协议的标配

使用A10单卡24G复现DeepSeek R1强化学习过程

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

为什么一定要做Agent智能体？

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

Multi-Agent实践第7期：智能体的高效协作

Higress 全新 Wasm 运行时，性能大幅提升