官方博客-第22页-阿里云开发者社区

阿里云云原生

2024-11-01

953

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

953

新念

2025-02-14

1391

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,391

阿里云云原生

473

Serverless JManus: 企业生产级通用智能体运行时

JManus 是面向 Java 的企业级通用智能体框架，支持多 Agent 框架、MCP 协议和 PLAN-ACT 模式，具备高可用、弹性伸缩的特性。结合阿里云 Serverless 运行时 SAE 和 FC，实现稳定安全的智能体应用部署与运行。

阿里云云原生

473

栾枝

2023-07-18

131005

手把手教你使用OSS-HDFS服务平替自建HDFS

本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

栾枝

131,005

元毅

2024-05-15

716

解密最受欢迎的开源 Serverless 框架：流量篇

元毅

716

德灵

2024-05-15

118027

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,027

ModelScope

2024-05-15

480

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

480

作霖

2024-05-15

560

ADB PG是一个经典MPP数据库，长项在于查询分析处理，面对客户联机分析和联机交易（HTAP）场景就显得力不从心，我们在某银行核心系统DB2 for LUW迁移到ADB PG时就遇到类似问题，因此我们提出ADB PG+RDS PG混搭技术架构，来解决客户此类HTAP需求。该混搭架构的精髓在于扬长避短，充分发挥分析型数据库和交易型数据库的长处和特性，分析型数据库专注于数据加工跑批场景，然后批量加工的结果数据卸载到RDS PG，通过RDS PG对外提供高并发对客交易服务。

作霖

560

陈浩章颖强

2024-05-29

55697

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,697

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

DeepSeek-V3 高效训练关键技术分析

Serverless JManus: 企业生产级通用智能体运行时

手把手教你使用OSS-HDFS服务平替自建HDFS

解密最受欢迎的开源 Serverless 框架：流量篇

阿里云PAI大模型RAG对话系统最佳实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

ADB PG最佳实践之高效复制数据到RDS PG

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

DeepSeek-V3 高效训练关键技术分析

Serverless JManus: 企业生产级通用智能体运行时

手把手教你使用OSS-HDFS服务平替自建HDFS

解密最受欢迎的开源 Serverless 框架：流量篇

阿里云PAI大模型RAG对话系统最佳实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

ADB PG最佳实践之高效复制数据到RDS PG

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移