官方博客-第17页-阿里云开发者社区

子白

2024-05-15

102475

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,475

ModelScope

2024-05-15

110024

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,024

阿里云云原生

2024-05-15

55732

Higress 全新 Wasm 运行时，性能大幅提升

本文介绍 Higress 将 Wasm 插件的运行时从 V8 切换到 WebAssembly Micro Runtime (WAMR) 的最新进展。

阿里云云原生

55,732

阿里云存储

2024-07-16

20481

几百T的视频、图片数据进行更有效地存储和管理

采用传统硬盘搭建存储方案，看起来成本低廉，但是再加上各种附加因素后却大幅攀升，而云存储厂商通常提供基于订阅的定价模型、一些免费服务和一定的折扣。现在，我们就来了解一下如何更省钱地使用云存储。

阿里云存储

20,481

寒斜

2024-11-19

783

基于事件驱动构建 AI 原生应用

AI 应用在商业化服务的阶段会面临诸多挑战，比如更快的服务交付速度，更实时、精准的结果以及更人性化的体验等，传统架构限制于同步交互，无法满足上述需求，本篇文章给大家分享一下如何基于事件驱动架构应对上述挑战。

寒斜

783

柳遵飞

2024-11-22

1345

Spring Cloud+Nacos+KMS 动态配置最佳实践

本文讲述了 Spring Cloud 应用中结合 Nacos 实现了运行期配置动态更新的功能，以及在此基础上结合 KMS 在不改动代码的情况下对应用使用的敏感配置进行保护，解决将配置迁移到 Nacos 中可能存在的数据安全顾虑，并对其底层工作原理做了简单介绍。

柳遵飞

1,345

勉成

2024-12-12

600

如何找出Java进程占用CPU高的元凶

本文记录了一次Java进程CPU占用率过高的问题和排查思路。

勉成

600

新念

2025-02-14

1450

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,450

丕天

2025-03-21

1160

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,160

官方博客-第17页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Higress 全新 Wasm 运行时，性能大幅提升

几百T的视频、图片数据进行更有效地存储和管理

基于事件驱动构建 AI 原生应用

Spring Cloud+Nacos+KMS 动态配置最佳实践

如何找出Java进程占用CPU高的元凶

DeepSeek-V3 高效训练关键技术分析

AI 推理场景的痛点和解决方案

官方博客-第17页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Higress 全新 Wasm 运行时，性能大幅提升

几百T的视频、图片数据进行更有效地存储和管理

基于事件驱动构建 AI 原生应用

Spring Cloud+Nacos+KMS 动态配置最佳实践

如何找出Java进程占用CPU高的元凶

DeepSeek-V3 高效训练关键技术分析

AI 推理场景的痛点和解决方案