官方博客-第18页-阿里云开发者社区

坤硕

2024-07-29

20040

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点，本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战，近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践，一起来了解下吧。

坤硕

20,040

阿里云云原生

2024-11-01

953

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

953

沈炼

2024-12-13

1535

从大数据到大模型：如何做到“心无桎梏，身无藩篱”

在大数据和大模型的加持下，现代数据技术释放了巨大的技术红利，通过多种数据范式解除了数据的桎梏，使得应用程序达到了“心无桎梏，身无藩篱”的自在境界，那么现代应用有哪些数据范式呢？这正是本文尝试回答的问题。

沈炼

1,535

榆松

2025-01-14

1156

网络分析与监控：阿里云拨测方案解密

阿里云网络拨测业务提供了全球、多种协议、多种网络态势的用户网络性能和用户体验监控场景的全面可观测方案。该文章从拨测场景下，介绍了用户如何快速的构建一套全球用户视角的服务可用性大盘，为客户的业务保驾护航。

榆松

1,156

荣阳

2025-02-28

1019

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,019

澄潭计缘望宸

2025-03-14

952

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

952

隆基

2024-05-15

109219

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

本文主要学习 RocketMQ 的一致性特性，一致性对于交易、金融都是刚需。从大规模复杂业务出发，学习 RocketMQ 的 SQL 订阅、定时消息等特性。再从高可用的角度来看，这里更多的是大型公司对于高阶可用性的要求，如同城容灾、异地多活等。

隆基

109,219

阿里云大数据Al技术

2024-05-15

145439

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

本教程将带领大家免费领取阿里云PAI-EAS的免费试用资源，并且带领大家在 ComfyUI 环境下使用 SVD的模型，根据任何图片生成一个小短视频。

阿里云大数据Al技术

145,439

阿里云瑶池数据库

2024-06-25

24736

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

在今年的SIGMOD会议上，阿里云瑶池数据库团队的论文《PolarDB-MP: A Multi-Primary Cloud-Native Database via Disaggregated Shared Memory》获得了Industry Track Best Paper Award，这是中国企业独立完成的成果首次摘得SIGMOD最高奖。PolarDB-MP是基于分布式共享内存的多主云原生数据库，本文将介绍这篇论文的具体细节。

阿里云瑶池数据库

24,736

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

Serverless GPU：助力 AI 推理加速

从大数据到大模型：如何做到“心无桎梏，身无藩篱”

网络分析与监控：阿里云拨测方案解密

使用A10单卡24G复现DeepSeek R1强化学习过程

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

Serverless GPU：助力 AI 推理加速

从大数据到大模型：如何做到“心无桎梏，身无藩篱”

网络分析与监控：阿里云拨测方案解密

使用A10单卡24G复现DeepSeek R1强化学习过程

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

一键生成视频，用 PAI-EAS 部署 AI 视频生成模型 SVD 工作流

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题