弹性计算双周刊 第 25 期

简介: 弹性计算双周刊 第25期

【重点关注】
阿里云GPU云服务器现已支持NVIDIA RAPIDS加速库,是国内第一家提供RAPIDS加速库服务的公有云厂商
RAPIDS,全称Real-time Acceleration Platform for Integrated Data Science,是NVIDIA针对数据科学和机器学习推出的一套开源GPU加速库,基于CUDA-X AI打造,可加速数据准备、模型训练和图分析。使用RAPIDS加速库可以实现从数据准备、模型训练到预测整个端到端流程得到GPU的加速支持,大大提升任务的执行效率,在模型精度方面实现突破的同时降低基础架构TCO。

专有宿主机DDH提供“自动部署”能力,实现云上独占资源池,提升集群部署效率
在专有宿主机上创建ECS实例时,用户获得了指定宿主机创建实例的自由。当具有多台宿主机的时候,通过宿主机“允许自动部署”(AutoPlacement)和ECS实例“主机亲和性”(Affinity)属性,可以实现宿主机资源池的集群化管理。包括:为重要业务保留不允许自动部署的资源池,而对于允许自动部署的资源池,在创建ECS实例时,无需手动指定宿主机,系统实现自动均衡调度。

【产品资讯】
阿里云超算,弹性影视渲染方案实战
阿里云超算EHPC的自动伸缩,快速自动扩容能力和DCC行业灵活多变的渲染业务需求相结合,加上集谛CloudMetrics 的实时监控,让基于deadline的影视特效VFX渲染体验如行云流水。
image

弹性容器实例 ECI 新上线(北京G、杭州I、上海F、上海G、深圳E 可用区)
ECI 上线5个最新可用区,提供充足的资源供给,满足客户的弹性资源需求,目前 ECI 已经支持 7大地域和29个可用区

【最佳实践】
专有宿主机如何实现“资源池”管理

在专有宿主机上创建ECS实例时,用户获得了指定宿主机创建实例的自由。但是当具有多台宿主机的时候,每次创建实例都需要输入宿主机ID,也给资源部署造成了不必要的麻烦。为了解决这个困扰,便于宿主机资源池的集群化管理,阿里云为专有宿主机用户提供了两个提升管理自由度的新特性:
专有宿主机提供:“允许自动部署”(AutoPlacement)属性
专有宿主机上创建的ECS实例提供:“主机亲和性”(Affinity)属性

AutoScaling 步进伸缩规则
步进伸缩规则是弹性伸缩基于云监控报警服务为用户提供的分段扩缩容策略,是对现有简单伸缩规则的扩展,为用户的动态扩缩容过程提供更精细的控制。步进伸缩规则在原有简单伸缩规则的基础上增加了分步定义,步进伸缩规则是简单伸缩规则的超集。步进伸缩规则允许用户指定一组扩展策略集合,这些扩展策略将根据报警监控值的违例规模来选择合适的分步步骤进行执行。

操作文档:
事件通知,https://help.aliyun.com/document_detail/116341.html
通过内网调用APIhttps://help.aliyun.com/document_detail/117461.html

在GPU实例上使用RAPIDS加速机器学习任务
https://help.aliyun.com/document_detail/117924.html
弹性伸缩,创建预测规则https://help.aliyun.com/document_detail/119069.html
专有宿主机,通过专有宿主机实现自建“资源池”

支持调用API创建预付费磁盘 https://help.aliyun.com/document_detail/25513.html

目录
相关文章
|
Oracle 关系型数据库 数据库
OceanBase数据库常见问题之租户创建后想要改字符集如何解决
OceanBase 是一款由阿里巴巴集团研发的企业级分布式关系型数据库,它具有高可用、高性能、可水平扩展等特点。以下是OceanBase 数据库使用过程中可能遇到的一些常见问题及其解答的汇总,以帮助用户更好地理解和使用这款数据库产品。
|
安全 Java Android开发
构建高效安卓应用:探究Kotlin与Java的性能对比
【2月更文挑战第22天】 在移动开发的世界中,性能优化一直是开发者们追求的关键目标。随着Kotlin在安卓开发中的普及,许多团队面临是否采用Kotlin替代Java的决策。本文将深入探讨Kotlin和Java在安卓平台上的性能差异,通过实证分析和基准测试,揭示两种语言在编译效率、运行时性能以及内存占用方面的表现。我们还将讨论Kotlin的一些高级特性如何为性能优化提供新的可能性。
999 0
|
机器学习/深度学习 人工智能 自然语言处理
ICLR 2025 | EDiT:一种基于 Local SGD 策略的大模型高效分布式训练方法
蚂蚁 AI Infra 团队在深度学习最核心之一的训练框架方向上持续投入与创新,实现了提升资源利用率、加速训练、提升训练稳定性等目标。我们提出的 EDiT 方法,即为其中一项工作。
|
敏捷开发 运维 Devops
如何构建高效的价值交付系统?详解项目管理中的核心要素
3分钟了解价值交付系统的组成和使用方法。
491 0
如何构建高效的价值交付系统?详解项目管理中的核心要素
|
搜索推荐 JavaScript 数据可视化
uniapp/vue个性化单选、复选组件
uniapp/vue个性化单选、复选组件
583 5
|
存储 小程序 API
|
分布式计算 资源调度 Hadoop
大数据-01-基础环境搭建 超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece
大数据-01-基础环境搭建 超详细 Hadoop Java 环境变量 3节点云服务器 2C4G XML 集群配置 HDFS Yarn MapRedece
444 4
|
机器学习/深度学习 存储 Kubernetes
如何将 Apache Airflow 用于机器学习工作流
Apache Airflow 是一个流行的平台,用于在 Python 中创建、调度和监控工作流。 它在 Github 上有超过 15,000 颗星,被 Twitter、Airbnb 和 Spotify 等公司的数据工程师使用。 如果您使用的是 Apache Airflow,那么您的架构可能已经根据任务数量及其要求进行了演变。 在 Skillup.co 工作时,我们首先有几百个 DAG 来执行我们所有的数据工程任务,然后我们开始做机器学习。
|
安全 前端开发 rax
PWN练习---Stack_2
PWN练习---Stack_2
|
存储 Kubernetes 数据安全/隐私保护
k8s详细教程(二)
k8s详细教程(二)
519 0

热门文章

最新文章