2024-05-15
259

基于ASK+TFJob快速完成分布式Tensorflow训练任务

本文介绍如何使用TFJob在ASK+ECI场景下,快速完成基于GPU的TensorFlow分布式训练任务。

259
2024-05-15
2460

阿里云大降价后,再谈“降本增效”

2024年2月29日,阿里云宣布史上最大力度降价,引发行业对用云成本的热议。

2024-05-15
145776

弹性调度助力企业灵活应对业务变化,高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化,并高效管理云上资源。

145,776
2024-05-15
92752

阿里云云原生弹性方案,用弹性解决集群资源利用率难题

本文主要介绍了通过弹性,实现成本优化,解决集群资源利用率难题。

92,752
2024-05-15
101670

大语言模型推理提速,TensorRT-LLM 高性能推理实践

大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型,本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

101,670
2024-05-15
1017

从方法论到最佳实践,深度解析企业云原生 DevSecOps 体系构建

本文主要介绍了云原生安全的现状以及企业应用在云原生化转型中面临的主要安全挑战以及相对成熟的一部分安全体系方法论,深度解析企业云原生 DevSecOps 体系构建。

1,017
2023-12-01
1026

Koordinator 助力云原生应用性能提升,小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录,介绍小红书通过规模化落地混部技术来大幅提升集群资源效能,降低业务资源成本。

1,026
2023-12-01
326

从零开始使用 ROS CDK 搭建云上解决方案

本文介绍了如何使用阿里云ROS资源编排服务快速部署和管理云资源。主要内容包括:1. 工具准备:安装ROSCDK,选择合适的代码编辑器和IDE,安装AI代码生成插件等。2. 环境准备:创建工程目录,进入虚拟环境,配置阿里云凭证信息,配置ROSCDK。3. 代码编写:根据文档描述,编写ROS代码来创建VPC、VSwitch、ECS等资源。4. 运行代码:执行ROS代码,创建ECS实例并部署FTP服务。总体来说,本文通过简单的步骤,让小白也能快速上手使用ROS资源编排服务,实现自动化部署和管理阿里云资源。

2023-09-26
138309

云原生场景下高可用架构的最佳实践

云原生场景下高可用架构的最佳实践

138,309
1
...
3
4
5
6
7
到第
1
2
3
4
5
6
7
6/7