官方博客-第10页-阿里云开发者社区

言澈

2024-05-15

1430

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

本文是[全景剖析容器网络数据链路]第三部分，主要介绍Kubernetes Terway ENIIP模式下，数据面链路的转转发链路。

言澈

1,430

景祁

2024-05-15

164481

设计与构建 FinOps 流程、团队、体系与目标

企业 FinOps 实施不是一蹴而就的项目，如果您正在推进企业云原生 FinOps 落地，除了选择合适的技术手段，企业内部的流程和体系建设也尤为重要。

景祁

164,481

资源编排ROS

2024-06-24

398

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

基于 IaC 的理念，通过定义一个模板，使用 ROS 提供的 Terraform 托管服务进行自动化部署，可以非常高效快捷地部署任意云资源和应用（比如 ChatTTS 服务）。相比于手动部署或者通过 API、SDK 的部署方式，有着高效、稳定等诸多优势，也是服务上云的最佳实践。

资源编排ROS

398

茏城

2024-06-28

1464

深度｜大模型时代下，基于湖仓一体的数据智能新范式

本次文根据峰会演讲内容整理：分享在大模型时代基于湖仓一体的数据产品演进，以及我们观察到的一些智能开发相关的新范式。

茏城

1,464

阿里云云原生

2024-11-01

953

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

953

阿里云实时计算Flink

2023-03-30

4955

Apache Paimon 在同程旅行的探索实践

本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。

阿里云实时计算Flink

4,955

资源编排ROS

2023-12-01

664

本文介绍了如何使用阿里云ROS资源编排服务快速部署和管理云资源。主要内容包括：1. 工具准备：安装ROSCDK,选择合适的代码编辑器和IDE,安装AI代码生成插件等。2. 环境准备：创建工程目录，进入虚拟环境，配置阿里云凭证信息，配置ROSCDK。3. 代码编写：根据文档描述，编写ROS代码来创建VPC、VSwitch、ECS等资源。4. 运行代码：执行ROS代码，创建ECS实例并部署FTP服务。总体来说，本文通过简单的步骤，让小白也能快速上手使用ROS资源编排服务，实现自动化部署和管理阿里云资源。

资源编排ROS

664

子白

2024-05-15

102409

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,409

王骜

2024-05-15

165214

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

本文介绍如何使用函数计算 GPU 实例闲置模式低成本、快速的部署 Google Gemma 模型服务。

王骜

165,214

官方博客-第10页-阿里云开发者社区

类目筛选

内容类型

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

设计与构建 FinOps 流程、团队、体系与目标

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

深度｜大模型时代下，基于湖仓一体的数据智能新范式

Serverless GPU：助力 AI 推理加速

Apache Paimon 在同程旅行的探索实践

从零开始使用 ROS CDK 搭建云上解决方案

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务

官方博客-第10页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

全景剖析阿里云容器网络数据链路（三）—— Terway ENIIP

设计与构建 FinOps 流程、团队、体系与目标

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

深度｜大模型时代下，基于湖仓一体的数据智能新范式

Serverless GPU：助力 AI 推理加速

Apache Paimon 在同程旅行的探索实践

从零开始使用 ROS CDK 搭建云上解决方案

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一键开启 GPU 闲置模式，基于函数计算低成本部署 Google Gemma 模型服务