ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

411

羿莉

2024-05-15

108

日志审计：多账号下VPC流日志采集与监控方案

本文主要介绍如何基于日志审计进行跨账号的VPC流日志采集与监控。

羿莉

108

阿里云实时数仓Hologres

2024-05-15

74405

大数据分析平台之 OLAP 架构的最佳实践

本文将分享聚水潭云原生 OLAP 架构的最佳实践。

阿里云实时数仓Hologres

74,405

阿里云云原生

2024-05-15

61149

云效 Pipeline as Code 来了，这些场景，用好它效率翻倍

可视化与YAML编排兼具，云效CI/CD流水线你愿意打几分？

阿里云云原生

61,149

阿里云瑶池数据库

2024-06-12

60261

突破大表瓶颈｜小鹏汽车使用PolarDB实现百亿级表高频更新和实时分析

PolarDB已经成为小鹏汽车应对TB级别大表标注、分析查询的"利器"。

阿里云瑶池数据库

60,261

阿里云云原生

2024-06-13

55557

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

区别于传统的流水线工具，本实验将带你体验云效应用交付平台 AppStack，从应用视角，完成一个 AI 聊天应用的高效交付。

阿里云云原生

55,557

阿里云云原生

2024-07-29

160

从供应商深度绑定，到走向真正的云原生，他们是这样做的

没有 K8s 的运维权限，开发者也能排查和定位问题。

阿里云云原生

160

资源编排ROS

2019-12-24

1904

资源编排ROS之自定制资源（基础篇）

本文介绍资源编排ROS的基础知识配置。

资源编排ROS

1,904

阿里云实时计算Flink

2023-04-13

871

海量数据实时分析引擎 Apache Flink

当系统出现大量或者重大的错误却不被人感知，将会对业务产生影响，从而导致资产损失。当竞争对手实施了新战术，却无法及时感知，跟不上竞争对手的节奏，总是追着对方尾巴走。当要做决策的时候，海量的业务数据增长却无法实时看到聚合结果，决策总是凭借过往经验或者过时的数据分析之上。

阿里云实时计算Flink

871

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

日志审计：多账号下VPC流日志采集与监控方案

大数据分析平台之 OLAP 架构的最佳实践

云效 Pipeline as Code 来了，这些场景，用好它效率翻倍

突破大表瓶颈｜小鹏汽车使用PolarDB实现百亿级表高频更新和实时分析

基于云效 AppStack，5 分钟搞定一个 AI 应用的开发和部署

从供应商深度绑定，到走向真正的云原生，他们是这样做的

资源编排ROS之自定制资源（基础篇）

海量数据实时分析引擎 Apache Flink