官方博客-第13页-阿里云开发者社区

望宸

2025-02-28

1034

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,034

丕天

2025-03-21

1078

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,078

隆基

2024-05-15

108438

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

从整体技术架构上学习 RocketMQ 5.0 的云原生架构、一体化架构，最后再分别从业务场景切入，详细介绍 RocketMQ 5.0 在不同的业务场景提供的能力和关键技术原理，包括业务消息、流处理、物联网以及面向云时代的事件驱动场景。

隆基

108,438

阿里云云原生

2024-05-15

55683

Higress 全新 Wasm 运行时，性能大幅提升

本文介绍 Higress 将 Wasm 插件的运行时从 V8 切换到 WebAssembly Micro Runtime (WAMR) 的最新进展。

阿里云云原生

55,683

赵世振

2024-07-30

1890

阿里云百炼应用实践系列-AI助手快速搭建

本文主要介绍如何基于阿里云百炼平台快速在10分钟为您的网站添加一个 AI 助手。我们基于阿里云百炼平台的能力，以官方帮助文档为参考，搭建了一个以便全天候（7x24）回应客户咨询的AI助手，介绍了相关技术方案和主要代码，供开发者参考。

赵世振

1,890

阿里云云原生

2024-12-17

816

10 分钟打造你的专属 AI 客服

在这个数字化时代，提供卓越的客户服务已成为企业脱颖而出的关键。为了满足这一需求，越来越多的企业开始探索人工智能（AI）助手的应用，以实现全天候（7x24）的客户咨询响应，全面提升用户体验和业务竞争力。本解决方案通过函数计算FC 和大模型服务平台百炼，为您提供一个高效便捷构建 AI 助手思路。

阿里云云原生

816

承慕

2025-01-02

1200

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强

在过去半年，ALB Ingress Controller推出了多项高级特性，包括支持AScript自定义脚本、慢启动、连接优雅中断等功能，增强了产品的灵活性和用户体验。此外，还推出了ingress2Albconfig工具，方便用户从Nginx Ingress迁移到ALB Ingress，以及通过Webhook服务实现更智能的配置校验，减少错误配置带来的影响。在容灾部署方面，支持了多集群网关，提高了系统的高可用性和容灾能力。这些改进旨在为用户提供更强大、更安全的云原生网关解决方案。

承慕

1,200

阿里云云原生

2025-01-26

1208

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,208

阿里云开发者

2025-03-21

765

在IDEA中借助满血版 DeepSeek 提高编码效率

通义灵码2.0引入了DeepSeek V3与R1模型，新增Qwen2.5-Max和QWQ模型，支持个性化服务切换。阿里云发布开源推理模型QwQ-32B，在数学、代码及通用能力上表现卓越，性能媲美DeepSeek-R1，且部署成本低。AI程序员功能涵盖表结构设计、前后端代码生成、单元测试与错误排查，大幅提升开发效率。跨语言编程示例中，成功集成DeepSeek-R1生成公告内容。相比1.0版本，2.0支持多款模型，丰富上下文类型，具备多文件修改能力。总结显示，AI程序员生成代码准确度高，但需参考现有工程风格以确保一致性，错误排查功能强大，适合明确问题描述场景。相关链接提供下载与原文参考。

阿里云开发者

765

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

大模型推理主战场：通信协议的标配

AI 推理场景的痛点和解决方案

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

Higress 全新 Wasm 运行时，性能大幅提升

阿里云百炼应用实践系列-AI助手快速搭建

10 分钟打造你的专属 AI 客服

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强

最近谈论 SSE 和 WebSocket 的人越来越多的原因

在IDEA中借助满血版 DeepSeek 提高编码效率

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理主战场：通信协议的标配

AI 推理场景的痛点和解决方案

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

Higress 全新 Wasm 运行时，性能大幅提升

阿里云百炼应用实践系列-AI助手快速搭建

10 分钟打造你的专属 AI 客服

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强

最近谈论 SSE 和 WebSocket 的人越来越多的原因

在IDEA中借助满血版 DeepSeek 提高编码效率