官方博客-第19页-阿里云开发者社区

阿里云云原生

2024-10-18

957

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

957

沈炼

2024-12-13

1534

从大数据到大模型：如何做到“心无桎梏，身无藩篱”

在大数据和大模型的加持下，现代数据技术释放了巨大的技术红利，通过多种数据范式解除了数据的桎梏，使得应用程序达到了“心无桎梏，身无藩篱”的自在境界，那么现代应用有哪些数据范式呢？这正是本文尝试回答的问题。

沈炼

1,534

新念

2025-02-14

1390

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,390

望雲十雨言澈

2025-04-10

520

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

520

栾枝

2023-07-18

131004

手把手教你使用OSS-HDFS服务平替自建HDFS

本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

栾枝

131,004

陈浩章颖强

2024-05-29

55694

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,694

阿里云大数据Al技术

2024-08-09

9090

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

9,090

阿里云云原生

2024-08-12

459

5 大场景上手通义灵码企业知识库 RAG

大家好，我是通义灵码，你的智能编程助手！今天就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

459

喻奎

2024-08-23

277

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

本文主要介绍基于 MaxCompute 的离线近实时一体化新架构如何来支持这些综合的业务场景，提供基于Delta Table的近实时增全量一体的数据存储和计算解决方案。

喻奎

277

官方博客-第19页-阿里云开发者社区

类目筛选

内容类型

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

从大数据到大模型：如何做到“心无桎梏，身无藩篱”

DeepSeek-V3 高效训练关键技术分析

AI Infra之模型显存管理分析

手把手教你使用OSS-HDFS服务平替自建HDFS

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

基于RAG搭建企业级知识库在线问答

5 大场景上手通义灵码企业知识库 RAG

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍

官方博客-第19页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

从大数据到大模型：如何做到“心无桎梏，身无藩篱”

DeepSeek-V3 高效训练关键技术分析

AI Infra之模型显存管理分析

手把手教你使用OSS-HDFS服务平替自建HDFS

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

基于RAG搭建企业级知识库在线问答

5 大场景上手通义灵码企业知识库 RAG

MaxCompute 近实时增全量处理一体化新架构和使用场景介绍