官方博客-第11页-阿里云开发者社区

阿里云云原生

2024-11-01

982

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

982

赵世振

2025-01-07

2626

阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点

本课程旨在介绍阿里云百炼大模型平台的核心功能和应用场景，帮助开发者和技术小白快速上手，体验AI的强大能力，并探索企业级AI应用开发的可能性。

赵世振

2,626

枫桥

2025-02-07

508

从铜线到云端：网络技术的跨越与未来趋势

本文围绕物理网络和云网络基础知识科普进行展开，最后浅谈在AI大模型浪潮下云网络的演进方向。

枫桥

508

言澈

2025-02-28

1185

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,185

兆维

2023-08-31

601

为什么 Higress 是 Knative 入口网关的最佳实践

Knative Serving 是一款基于 K8s 的 Serverless 开源平台，用于构建和管理现代化、可拓展、流量驱动、无服务器的应用程序。本文重点关注 Knative 网络层能力的实现。

兆维

601

隆基

2024-05-15

109243

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

本文主要学习 RocketMQ 的一致性特性，一致性对于交易、金融都是刚需。从大规模复杂业务出发，学习 RocketMQ 的 SQL 订阅、定时消息等特性。再从高可用的角度来看，这里更多的是大型公司对于高阶可用性的要求，如同城容灾、异地多活等。

隆基

109,243

徒钟

2024-05-15

189499

Apache RocketMQ ACL 2.0 全新升级

RocketMQ ACL 2.0 不管是在模型设计、可扩展性方面，还是安全性和性能方面都进行了全新的升级。旨在能够为用户提供精细化的访问控制，同时，简化权限的配置流程。欢迎大家尝试体验新版本，并应用在生产环境中。

徒钟

189,499

泮圣伟

2024-05-15

268

快速构建服务发现的高可用能力的实践介绍

本文是阿里云微服务引擎MSE在服务发现高可用的最佳实践介绍。

泮圣伟

268

钰诚

2024-08-12

559

使用 Higress 快速构建 AI 应用

Higress 基于企业内外的丰富场景沉淀了众多面向 AI 的功能，推出了 AI 原生的 API 网关形态并且全部开源。

钰诚

559

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点

从铜线到云端：网络技术的跨越与未来趋势

进行GPU算力管理

为什么 Higress 是 Knative 入口网关的最佳实践

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

Apache RocketMQ ACL 2.0 全新升级

快速构建服务发现的高可用能力的实践介绍

使用 Higress 快速构建 AI 应用

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点

从铜线到云端：网络技术的跨越与未来趋势

进行GPU算力管理

为什么 Higress 是 Knative 入口网关的最佳实践

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

Apache RocketMQ ACL 2.0 全新升级

快速构建服务发现的高可用能力的实践介绍

使用 Higress 快速构建 AI 应用