官方博客-第17页-阿里云开发者社区

子白

2024-05-15

102407

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,407

澄潭钰诚

2024-07-19

21892

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

Higress 最新的 1.4 版本基于为通义千问，以及多家云上 AGI 厂商客户提供 AI 网关的积累沉淀，开源了大量 AI 原生的网关能力。同时也在 Ingress、可观测、流控等云原生能力上做了全方位升级。

澄潭钰诚

21,892

穹谷

2024-09-02

845

每个端侧产品都需要的用户体验监控

ARMS RUM 是阿里云应用实时监控服务（ARMS）下的用户体验监控（RUM）产品，覆盖 Web/H5、各类平台小程序、Android、iOS、Flutter、ReactNative、Windows、macOS 等平台框架。接入 SDK 后会主动采集端侧页面性能、资源加载、API 调用、异常崩溃、卡顿、用户操作、系统信息等数据，还支持事件、日志、异常等数据按需自定义上报以满足业务数据分析需求，提供全面的性能分析、异常分析、产品分析、会话分析能力，帮助快速跟踪定位问题原因，提升产品用户使用体验。

穹谷

845

李泽政

2024-11-01

781

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

本文中，阿里云智能集团开发工程师李泽政以 Alinux 为操作环境，讲解模块相比传统头文件有哪些优势，并通过若干个例子，学习如何组织一个 C++ 模块工程并使用模块封装第三方库或是改造现有的项目。

李泽政

781

阿里云云原生

2024-11-01

953

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

953

元昌

2024-11-21

584

构建理想容器镜像——以CSI为例

本文围绕阿里云CSI（Container Storage Interface）镜像构建的实际案例，探讨了一系列优化容器镜像的最佳实践。

元昌

584

阿里云云原生

2024-12-04

662

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

年会中的抽奖环节不可或缺，但每年为了选择合适的抽奖小程序，团队往往需要投入大量时间和精力。然而，抽奖结束后，参与者通常只记得自己是否中奖，其他细节多被遗忘。在 AI 技术日益成熟的今天，如何打造一个既高效又有技术含量的抽奖应用呢？今天，就让我们跟随通义灵码，仅用 5 分钟现场手撕一个抽奖应用吧！

阿里云云原生

662

榆松

2025-01-14

1155

网络分析与监控：阿里云拨测方案解密

阿里云网络拨测业务提供了全球、多种协议、多种网络态势的用户网络性能和用户体验监控场景的全面可观测方案。该文章从拨测场景下，介绍了用户如何快速的构建一套全球用户视角的服务可用性大盘，为客户的业务保驾护航。

榆松

1,155

殳玄

2025-01-16

964

现身说法，AI小白的大模型学习路径

写这篇文章的初衷：作为一个AI小白，把我自己学习大模型的学习路径还原出来，包括理解的逻辑、看到的比较好的学习材料，通过一篇文章给串起来，对大模型建立起一个相对体系化的认知，才能够在扑面而来的大模型时代，看出点门道。

殳玄

964

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

每个端侧产品都需要的用户体验监控

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

Serverless GPU：助力 AI 推理加速

构建理想容器镜像——以CSI为例

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

网络分析与监控：阿里云拨测方案解密

现身说法，AI小白的大模型学习路径

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

每个端侧产品都需要的用户体验监控

告别头文件，编译效率提升 42%！C++ Modules 实战解析 | 干货推荐

Serverless GPU：助力 AI 推理加速

构建理想容器镜像——以CSI为例

不写一行代码，通义灵码 5 分钟“手撕”年会抽奖程序

网络分析与监控：阿里云拨测方案解密

现身说法，AI小白的大模型学习路径