ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

363

严军

2024-05-15

259

DB2下移分布式数据库OceanBase单元化重构最佳实践

DB2下移分布式数据库OceanBase单元化重构最佳实践。

严军

259

子丑

2024-06-13

64947

基于 Nginx Ingress + 云效 AppStack 实现灰度发布

本文将演示结合云效 AppStack，来看下如何在阿里云 ACK 集群上进行应用的 Ingress 灰度发布。

子丑

64,947

阿里云PolarDB

2023-08-09

51308

PolarDB-X 针对跑批场景的思考和实践

金融行业和运营商系统，业务除了在线联机查询外，同时有离线跑批处理，跑批场景比较注重吞吐量，同时基于数据库场景有一定的使用惯性，比如直连MySQL分库分表的存储节点做本地化跑批、以及基于Oracle/DB2等数据库做ETL的数据清洗跑批等。

阿里云PolarDB

51,308

阿里云PolarDB

2023-11-01

2068

PolarDB-X V2.3 集中式和分布式一体化开源发布

本文主要介绍PolarDB-X V2.3 集中式和分布式一体化开源。

阿里云PolarDB

2,068

舲扬

2024-05-15

503

基于AnalyticDB PostgreSQL的实时物化视图研发实践

AnalyticDB PostgreSQL企业数据智能平台是构建数据智能的全流程平台，提供可视化实时任务开发 + 实时数据洞察，让您轻松平移离线任务，使用SQL和简单配置即可完成整个实时数仓的搭建。

舲扬

503

扬流

2024-05-15

118014

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

118,014

阿里云瑶池数据库

2024-06-18

255

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

论文提出的Flux通过使用AI技术将短时和长时查询解耦进行自动弹性，解决了云数据仓库的性能瓶颈，同时支持了资源按需预留。Flux优于传统的方法，查询响应时间 (RT) 最多可减少75%，资源利用率提高19.0%，成本开销降低77.8%。

阿里云瑶池数据库

255

怀虎

2024-07-08

46675

私网环境下使用云效流水线进行 CI/CD的方法

云效流水线可以托管用户的私网环境内的机器，并将构建任务调度到这些机器上，从而确保整个构建过程，和代码库和制品库的交互在私网环境下进行。

怀虎

46,675

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

DB2下移分布式数据库OceanBase单元化重构最佳实践

基于 Nginx Ingress + 云效 AppStack 实现灰度发布

PolarDB-X 针对跑批场景的思考和实践

PolarDB-X V2.3 集中式和分布式一体化开源发布

基于AnalyticDB PostgreSQL的实时物化视图研发实践

Paimon 与 Spark 的集成（二）：查询优化

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

私网环境下使用云效流水线进行 CI/CD的方法