ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

411

探索云世界

2024-05-15

126

函数计算 HTTP 触发器支持异步，解放双手搭建 Web 服务

当前阿里云函数计算支持两种类型的函数：事件函数和 HTTP 函数。其中 HTTP 函数结合 HTTP 触发器，能够支持用户直接通过 HTTP 请求利用 Restful API 的方式发起函数调用；通过这种方式，用户无需集成函数计算提供的 SDK 就能实现函数调用，更好地同已有系统的组件及 Web 服...

探索云世界

126

陈浩章颖强

2024-05-29

55226

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,226

阿里云大数据Al技术

2024-07-31

7057

OSS数据源一站式RAG最佳实践

本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

阿里云大数据Al技术

7,057

易霏夏花

2024-08-16

7334

PolarDB-X 存储引擎核心技术 | Lizard B+tree 优化

PolarDB-X 分布式数据库，采用集中式和分布式一体化的架构，为了能够灵活应对混合负载业务，作为数据存储的 Data Node 节点采用了多种数据结构，其中使用行存的结构来提供在线事务处理能力，作为 100% 兼容 MySQL 生态的数据库，DN 在 InnoDB 的存储结构基础上，进行了深度优化，大幅提高了数据访问的效率。

易霏夏花

7,334

继儒

2023-03-21

2281

Hologres技术揭秘，JSON半结构化数据的极致分析性能

本文将会揭秘Hologres JSONB半结构化数据的技术原理，实现JSON半结构数据的极致分析性能。

继儒

2,281

别梦

2023-08-16

677

MaxCompute ODPS重装上阵：PIVOT/UNPIVOT

MaxCompute推出新语法 - PIVOT/UNPIVOT：通过PIVOT关键字基于聚合将一个或者多个指定值的行转换为列；通过UNPIVOT关键字可将一个或者多个列转换为行。以更简洁易用的方式满足行转列和列转行的需求，简化了查询语句，提高了广大大数据开发者的生产力。

别梦

677

安正

2023-08-31

1120

便捷、快速、稳定、高性能，以 GPU 实例演示 Alibaba Cloud Linux 3 对 AI 生态的支持龙蜥技术

在多维度的优化加持下，Alibaba Cloud Linux 3 解决了 AI 开发人员的痛点问题，让 AI 开发体验更容易更高效。

安正

1,120

寒亭

2024-05-15

513

一次访问Redis延时高问题排查与总结

作者抽丝剥茧的记录了一次访问Redis延时高问题的排查和总结。

寒亭

513

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

函数计算 HTTP 触发器支持异步，解放双手搭建 Web 服务

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

OSS数据源一站式RAG最佳实践

PolarDB-X 存储引擎核心技术 | Lizard B+tree 优化

Hologres技术揭秘，JSON半结构化数据的极致分析性能

MaxCompute ODPS重装上阵：PIVOT/UNPIVOT

便捷、快速、稳定、高性能，以 GPU 实例演示 Alibaba Cloud Linux 3 对 AI 生态的支持龙蜥技术

一次访问Redis延时高问题排查与总结