官方博客-第18页-阿里云开发者社区

继儒

2023-03-21

3147

Hologres技术揭秘，JSON半结构化数据的极致分析性能

本文将会揭秘Hologres JSONB半结构化数据的技术原理，实现JSON半结构数据的极致分析性能。

继儒

3,147

阿里云网络

2023-07-12

931

阿里云飞天洛神云网络集中式网关ACMG最佳实践

云网络集中式网关ACMG的实践

阿里云网络

931

别梦

2023-08-16

1213

MaxCompute ODPS重装上阵：PIVOT/UNPIVOT

MaxCompute推出新语法 - PIVOT/UNPIVOT：通过PIVOT关键字基于聚合将一个或者多个指定值的行转换为列；通过UNPIVOT关键字可将一个或者多个列转换为行。以更简洁易用的方式满足行转列和列转行的需求，简化了查询语句，提高了广大大数据开发者的生产力。

别梦

1,213

ModelScope

2024-05-15

1188

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,188

右予故黎

2024-11-21

1008

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

1,008

阿里云云原生

2025-01-26

1289

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,289

新念

2025-02-14

1469

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,469

望宸

2025-02-20

688

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

688

言澈

2025-02-28

1218

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,218

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

Hologres技术揭秘，JSON半结构化数据的极致分析性能

阿里云飞天洛神云网络集中式网关ACMG最佳实践

MaxCompute ODPS重装上阵：PIVOT/UNPIVOT

vLLM部署Yuan2.0：高吞吐、更便捷

“无”中生有：基于知识增强的RAG优化实践

最近谈论 SSE 和 WebSocket 的人越来越多的原因

DeepSeek-V3 高效训练关键技术分析

大模型推理服务全景图

进行GPU算力管理

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Hologres技术揭秘，JSON半结构化数据的极致分析性能

阿里云飞天洛神云网络集中式网关ACMG最佳实践

MaxCompute ODPS重装上阵：PIVOT/UNPIVOT

vLLM部署Yuan2.0：高吞吐、更便捷

“无”中生有：基于知识增强的RAG优化实践

最近谈论 SSE 和 WebSocket 的人越来越多的原因

DeepSeek-V3 高效训练关键技术分析

大模型推理服务全景图

进行GPU算力管理