ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

363

阿里云云原生

2024-05-16

56180

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

56,180

阿里云PolarDB

2023-08-09

51308

PolarDB-X 针对跑批场景的思考和实践

金融行业和运营商系统，业务除了在线联机查询外，同时有离线跑批处理，跑批场景比较注重吞吐量，同时基于数据库场景有一定的使用惯性，比如直连MySQL分库分表的存储节点做本地化跑批、以及基于Oracle/DB2等数据库做ETL的数据清洗跑批等。

阿里云PolarDB

51,308

阿里云PolarDB

2023-11-01

2068

PolarDB-X V2.3 集中式和分布式一体化开源发布

本文主要介绍PolarDB-X V2.3 集中式和分布式一体化开源。

阿里云PolarDB

2,068

舲扬

2024-05-15

503

基于AnalyticDB PostgreSQL的实时物化视图研发实践

AnalyticDB PostgreSQL企业数据智能平台是构建数据智能的全流程平台，提供可视化实时任务开发 + 实时数据洞察，让您轻松平移离线任务，使用SQL和简单配置即可完成整个实时数仓的搭建。

舲扬

503

扬流

2024-05-15

118014

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

118,014

阿里云瑶池数据库

2024-06-18

255

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

论文提出的Flux通过使用AI技术将短时和长时查询解耦进行自动弹性，解决了云数据仓库的性能瓶颈，同时支持了资源按需预留。Flux优于传统的方法，查询响应时间 (RT) 最多可减少75%，资源利用率提高19.0%，成本开销降低77.8%。

阿里云瑶池数据库

255

阿里云瑶池数据库

2024-07-11

51

OpenAI的选择，实时数仓成为企业AI深度布局赛道

AnalyticDB：数据智能化先驱者

阿里云瑶池数据库

51

阿里云瑶池数据库

2024-07-18

69

Redis Proxy RT上升后连接倾斜

本文细致地描述了关于Redis Proxy RT上升后连接倾斜问题的排查过程和根本原因，最后给出了优化方案。

阿里云瑶池数据库

69

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

PolarDB-X 针对跑批场景的思考和实践

PolarDB-X V2.3 集中式和分布式一体化开源发布

基于AnalyticDB PostgreSQL的实时物化视图研发实践

Paimon 与 Spark 的集成（二）：查询优化

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

OpenAI的选择，实时数仓成为企业AI深度布局赛道

Redis Proxy RT上升后连接倾斜