闵子

2023-12-01

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

1,049

子白

2024-05-15

101024

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,024

扬流

2024-05-15

118011

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

118,011

阿里云云原生

2024-07-29

109

从供应商深度绑定，到走向真正的云原生，他们是这样做的

没有 K8s 的运维权限，开发者也能排查和定位问题。

阿里云云原生

109

致问

2023-09-15

119386

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

119,386

言澈

2024-05-15

232

全景剖析阿里云容器网络数据链路（四）—— Terway IPVLAN+EBPF

本文是[全景剖析容器网络数据链路]第四部分部分，主要介绍Kubernetes Terway EBPF+IPVLAN模式下，数据面链路的转转发链路。

言澈

232

刘佳旭

2023-09-26

138046

云原生场景下高可用架构的最佳实践

刘佳旭

138,046

ModelScope

2024-05-15

359

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

359

阿里云大数据Al技术

2024-05-15

77684

【AAAI 2024】MuLTI：高效视频与语言理解

多模态理解模型具有广泛的应用，比如多标签分类、视频问答（videoQA）和文本视频检索等。现有的方法已经在视频和语言理解方面取得了重大进展，然而，他们仍然面临两个巨大的挑战：无法充分的利用现有的特征；训练时巨大的GPU内存消耗。我们提出了MuLTI，这是一种高度准确高效的视频和语言理解模型，可以实现高效有效的特征融合和对下游任务的快速适应。本文详细介绍基于MuLTI实现高效视频与语言理解。

阿里云大数据Al技术

77,684

类目筛选

内容类型

从浏览器原理出发聊聊Chrome插件

大语言模型推理提速，TensorRT-LLM 高性能推理实践

Paimon 与 Spark 的集成（二）：查询优化

从供应商深度绑定，到走向真正的云原生，他们是这样做的

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

全景剖析阿里云容器网络数据链路（四）—— Terway IPVLAN+EBPF

云原生场景下高可用架构的最佳实践

vLLM部署Yuan2.0：高吞吐、更便捷

【AAAI 2024】MuLTI：高效视频与语言理解