2024-05-15
101012

大语言模型推理提速,TensorRT-LLM 高性能推理实践

大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

101,012
2023-02-22
21871

Flink CDC+Kafka 加速业务实时化

阿里巴巴开发工程师,Apache Flink Committer 任庆盛,在 9 月 24 日 Apache Flink Meetup 的分享。

21,871
2023-12-01
1035

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

1,035
2022-12-13
1818

技术原理,Hologres Binlog技术原理揭秘

详细介绍Hologres Binlog技术原理以及最佳实践。

1,818
2023-07-27
43384

一文详解Spring Bean循环依赖

本文主要梳理了Spring解决bean循环依赖的思路。

2023-08-15
21565

迄今为止最完整的DDD实践

对于一个架构师来说,在软件开发中如何降低系统复杂度是一个永恒的挑战。

21,565
2023-10-17
687

使用ECS部署并使用Docker

本文介绍如何在云服务ECS实例上,部署并使用Docker。

2023-03-21
2232

Hologres技术揭秘,JSON半结构化数据的极致分析性能

本文将会揭秘Hologres JSONB半结构化数据的技术原理,实现JSON半结构数据的极致分析性能。

2,232
2023-08-11
798

Linux 内存管理新特性:Memory folios 解读

本文主要讲解folio ,极其在应用中的直接价值。

798
1
2
3
4
...
15
到第
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
2/15