官方博客-第16页-阿里云开发者社区

榆松

2025-01-14

1397

网络分析与监控：阿里云拨测方案解密

阿里云网络拨测业务提供了全球、多种协议、多种网络态势的用户网络性能和用户体验监控场景的全面可观测方案。该文章从拨测场景下，介绍了用户如何快速的构建一套全球用户视角的服务可用性大盘，为客户的业务保驾护航。

榆松

1,397

望宸

2025-02-28

1298

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,298

丕天

2025-03-21

1302

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,302

阿里云云原生

2025-06-30

538

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

538

恶来

2023-05-15

7595

消息队列之 MetaQ 和 Kafka 区别和优势详解

本篇文章介绍MetaQ和Kafka这两个消息队列的区别和优势。

恶来

7,595

ModelScope

2024-05-15

910

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

Mistral AI在3月24日突然发布并开源了 Mistral 7B v0.2模型，有如下几个特点

ModelScope

910

ModelScope

2024-05-15

2046

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

2,046

涯海

2025-01-17

804

链路诊断最佳实践：1 分钟定位错慢根因

本文聚焦于线上应用的风险管理，特别是针对“错”（程序运行不符合预期）和“慢”（性能低下或响应迟缓）两大类问题，提出了一个系统化的根因诊断方案。

涯海

804

澄潭计缘望宸

2025-03-14

1174

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,174

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

网络分析与监控：阿里云拨测方案解密

大模型推理主战场：通信协议的标配

AI 推理场景的痛点和解决方案

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

消息队列之 MetaQ 和 Kafka 区别和优势详解

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

链路诊断最佳实践：1 分钟定位错慢根因

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

网络分析与监控：阿里云拨测方案解密

大模型推理主战场：通信协议的标配

AI 推理场景的痛点和解决方案

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

消息队列之 MetaQ 和 Kafka 区别和优势详解

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

链路诊断最佳实践：1 分钟定位错慢根因

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要