官方博客-第4页-阿里云开发者社区

承慕

2025-01-02

1202

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强

在过去半年，ALB Ingress Controller推出了多项高级特性，包括支持AScript自定义脚本、慢启动、连接优雅中断等功能，增强了产品的灵活性和用户体验。此外，还推出了ingress2Albconfig工具，方便用户从Nginx Ingress迁移到ALB Ingress，以及通过Webhook服务实现更智能的配置校验，减少错误配置带来的影响。在容灾部署方面，支持了多集群网关，提高了系统的高可用性和容灾能力。这些改进旨在为用户提供更强大、更安全的云原生网关解决方案。

承慕

1,202

言澈

2025-02-28

1154

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,154

阿里云云原生

2025-05-06

829

通过 MCP 构建企业级数据分析 Agent

本文介绍了使用阿里云实时数仓 Hologres、函数计算 FC 和通义大模型 Qwen3 构建企业级数据分析 Agent 的方法。通过 MCP（模型上下文协议）标准化接口，解决大模型与外部工具和数据源集成的难题。Hologres 提供高性能数据分析能力，支持实时数据接入和湖仓一体分析；函数计算 FC 提供弹性、安全的 Serverless 运行环境；Qwen3 具备强大的多语言处理和推理能力。方案结合 ModelScope 的 MCP Playground，实现高效的服务化部署，帮助企业快速构建跨数据源、多步骤分解的数据分析 Agent，优化数据分析流程并降低成本。

阿里云云原生

829

资源编排ROS

2024-06-24

398

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

基于 IaC 的理念，通过定义一个模板，使用 ROS 提供的 Terraform 托管服务进行自动化部署，可以非常高效快捷地部署任意云资源和应用（比如 ChatTTS 服务）。相比于手动部署或者通过 API、SDK 的部署方式，有着高效、稳定等诸多优势，也是服务上云的最佳实践。

资源编排ROS

398

尹斌斌周絮

2025-03-21

746

解决隐式内存占用难题

本文详细介绍了在云原生和容器化部署环境中，内存管理和性能优化所面临的挑战及相应的解决方案。

尹斌斌周絮

746

阿里云实时计算Flink

2023-03-30

4955

Apache Paimon 在同程旅行的探索实践

本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。

阿里云实时计算Flink

4,955

资源编排ROS

2023-12-01

664

从零开始使用 ROS CDK 搭建云上解决方案

本文介绍了如何使用阿里云ROS资源编排服务快速部署和管理云资源。主要内容包括：1. 工具准备：安装ROSCDK,选择合适的代码编辑器和IDE,安装AI代码生成插件等。2. 环境准备：创建工程目录，进入虚拟环境，配置阿里云凭证信息，配置ROSCDK。3. 代码编写：根据文档描述，编写ROS代码来创建VPC、VSwitch、ECS等资源。4. 运行代码：执行ROS代码，创建ECS实例并部署FTP服务。总体来说，本文通过简单的步骤，让小白也能快速上手使用ROS资源编排服务，实现自动化部署和管理阿里云资源。

资源编排ROS

664

子白

2024-05-15

102409

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,409

王骜

2024-05-15

165214

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

165,214

官方博客-第4页-阿里云开发者社区

类目筛选

内容类型

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强

进行GPU算力管理

通过 MCP 构建企业级数据分析 Agent

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

解决隐式内存占用难题

Apache Paimon 在同程旅行的探索实践

从零开始使用 ROS CDK 搭建云上解决方案

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

官方博客-第4页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

云原生应用网关进阶：阿里云网络ALB Ingress 全能增强

进行GPU算力管理

通过 MCP 构建企业级数据分析 Agent

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

解决隐式内存占用难题

Apache Paimon 在同程旅行的探索实践

从零开始使用 ROS CDK 搭建云上解决方案

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务