客户实践:易点天下的全球化智能引擎
2025年云栖大会 | 阿里云中企出海技术分论坛,易点天下 Infra高级技术总监 杨钊带来《云网无界——易点天下的全球化智能引擎》的主题分享,分享易点天下携手阿里云全球化云网络打造全球化智能营销平台,助力上万家中国企业出海的最佳实践。
产品发布:构建弹性、智能的应用交付网络
2025年云栖大会 | 云网络技术分论坛,阿里云智能集团 云网络高级产品技术专家 贺剑带来《构建弹性、智能的应用交付网络》的主题演讲,介绍过去1年阿里云网络在构建应用交付网络的GA/SLB/EIP等产品的Update
产品发布:构建可靠、高效的全球互联网络
2025年云栖大会 | 云网络技术分论坛,阿里云智能集团 云网络高级产品技术专家 孙佳辉带来《构建可靠、高效的全球互联网络》的主题演讲,介绍过去1年阿里云网络在构建全球化互联网络的CEN/TR/VPN等产品的Update。
产品发布:构建高吞吐、低时延、全链路安全的云上数据中心
2025年云栖大会 | 云网络技术分论坛,阿里云智能集团 云网络高级产品技术专家 彭昔敏带来《构建高吞吐、低时延、全链路安全的云上数据中心》的主题演讲,介绍过去1年阿里云网络在构建云上数据中心网络的VPC/NAT/Privatelink等产品的Update
122_集群管理:Slurm配置 - 优化大规模训练调度
在2025年,大规模语言模型(LLM)的训练已经进入到超大规模时代,模型参数量达到数千亿甚至万亿级别,训练过程需要动用数百甚至数千个GPU/TPU。在这种情况下,高效的集群管理系统成为训练成功的关键基础设施。Slurm(Simple Linux Utility for Resource Management)作为目前最流行的开源作业调度系统,广泛应用于科研机构和大型科技公司的超级计算集群中。