官方博客-第4页-阿里云开发者社区

子白

2024-05-15

102409

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,409

王骜

2024-05-15

165214

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

165,214

太业

2024-09-27

793

跟着iLogtail学习容器运行时与K8s下日志采集方案

iLogtail 作为开源可观测数据采集器，对 Kubernetes 环境下日志采集有着非常好的支持，本文跟随 iLogtail 的脚步，了解容器运行时与 K8s 下日志数据采集原理。

太业

793

阿里云实时数仓Hologres

2022-12-06

1626

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效。

阿里云实时数仓Hologres

1,626

隽驰

2022-12-28

1603

阿里CCO基于Hologres的亿级明细BI探索分析实践

阿里CCO基于Hologres的亿级明细BI探索分析实践。

隽驰

1,603

元毅

2024-05-15

715

解密最受欢迎的开源 Serverless 框架：流量篇

元毅

715

吴昆

2024-05-15

49918

秒级弹性，探索弹性调度与虚拟节点如何迅速响应瞬时算力需求

秒级弹性！探索弹性调度与虚拟节点如何迅速响应瞬时算力需求？

吴昆

49,918

杨永

2024-05-15

1441

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

针对Springboot里面使用开源工具使用加解密，替换成阿里云KMS产品进行加解密；

杨永

1,441

阿里云实时数仓Hologres

2024-05-15

75039

大数据分析平台之 OLAP 架构的最佳实践

本文将分享聚水潭云原生 OLAP 架构的最佳实践。

阿里云实时数仓Hologres

75,039

官方博客-第4页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

跟着iLogtail学习容器运行时与K8s下日志采集方案

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效

阿里CCO基于Hologres的亿级明细BI探索分析实践

解密最受欢迎的开源 Serverless 框架：流量篇

秒级弹性，探索弹性调度与虚拟节点如何迅速响应瞬时算力需求

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

大数据分析平台之 OLAP 架构的最佳实践

官方博客-第4页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

跟着iLogtail学习容器运行时与K8s下日志采集方案

升级JSONB列式存储，Hologres助力淘宝搜索2022双11降本增效

阿里CCO基于Hologres的亿级明细BI探索分析实践

解密最受欢迎的开源 Serverless 框架：流量篇

秒级弹性，探索弹性调度与虚拟节点如何迅速响应瞬时算力需求

使用阿里云KMS产品针对 Springboot 接口参数加密解密功能

大数据分析平台之 OLAP 架构的最佳实践