2021 年图灵奖公布!高性能计算先驱 Jack Dongarra 获奖

简介: 3 月 30 日,2021 ACM图灵奖正式揭晓,凭借对数值算法和库的开创性贡献,72 岁的美国田纳西大学电子工程和计算机科学系教授 Jack Dongarra 获此殊荣。

Jack Dongarra 斩获 2021 图灵奖

图灵奖常被称作“计算机界的诺贝尔奖”,全称 A.M.图灵奖(ACM A.M Turing Award),是由美国计算机协会(ACM)于 1966 年设立的计算机奖项,奖项名称是为了纪念在数学基础与计算边界的探索中做出巨大贡献的英国数学家阿兰·图灵。

该奖旨在奖励对计算机事业作出重要贡献的个人,并对获奖条件要求极高,评奖程序极严,一般每年仅授予一名计算机科学家。图灵奖奖金由 Google 公司赞助,为 100 万美元。

3 月 30 日,ACM 提名 Jack Dongarra 为 2021 年 ACM 图灵奖获得者。据悉,Dongarra 目前担任田纳西大学电气工程与计算机科学系特任教授,同时在橡树岭国家实验室和曼彻斯特大学兼任职务。

ACM 表示,Dongarra 的算法与软件成果推动了高性能计算的发展,并给人工智能、计算机图形学等诸多计算科学领域带来深远影响。如果没有 Dongarra 在线性代数运算的高效数值算法、并行计算编程机制与性能评估工具等领域的卓越贡献,也许高性能计算永远无法达到如今的高度。

近四十年来,摩尔定律指引下的硬件性能保持着指数级高增长,但在此期间大多数软件始终难以跟上如此迅猛的硬件发展节奏。归功于 Dongarra 发明的算法、优化技术与稳健可靠的软件实现成果,高性能数值软件成为少数能够与硬件提升齐头并进的负载类型。

ACM 主席 Gabriele Kotsis 表示:

“如今,最强大的超级计算机得到连篇累牍的报道,并凭借着一秒之内上万亿次的惊人算力吸引着公众讶异的目光。但除了一次次创下新纪录之外,高性能计算还一直在科学发现领域发挥着重要作用。高性能计算的创新成果也已经渗透到众多其他计算领域,推动着整个计算行业的发展。Jack Dongarra 正是这波发展浪潮的重要推动者之一,不仅从 1979 年起就致力于计算方面的开创性工作,时至今日也仍然是高性能计算社区中最重要、最具活力的一位领导者。他的整个职业生涯,无疑正是对图灵奖提出的「具有深远影响的重大贡献」的最佳注解。”

Google 高级研究人员、Google Research & Google Health 高级副总裁 Jeff Dean 也提到:

“Jack Dongarra 的工作从根本上改变并推动着科学计算的发展。他倾力打造的数值软件库已经成为各个科学计算领域所高度依赖的核心成果,帮助药物发现、气象预测乃至空天工程等十几个领域获得持续发展的动力。他对计算机广泛性能表征的深入研究,也催生出计算机架构在契合数值计算需求方面的一系列重大进步。”

重要技术贡献

四十多年以来,Dongarra 一直是 LINPACK、BLAS、LAPACK、ScaLAPACK、PLASMA、MAGMA 和 SLATE 等库的主要参与者或首席研究员。这些库能够顺利运行在单处理器、并行计算机、多核节点以及多 GPU 节点之上。他的软件库在高性能科学与工程计算中得到广泛普及,相关负载遍布从笔记本电脑到世界顶尖超级计算机的各类平台。

这些库也是他深度技术创新的切实体现,包括:

自动调优:2016 年,他负责的项目 ATLAS 获得全球超级计算大会时间检验奖。在项目中,Dongarra 设计出一种开创性方法,能够以自动方式查找出能够生成近最优效率线性代数内核的算法参数,且表现优于原有代码;

混合精度算术:在 2006 年全球超级计算大会上发表的论文《以 32 位浮点运算性能获得 64 位运算精度》(Exploiting the Performance of 32 bit Floating Point Arithmetic in Obtaining 64 bit Accuracy)当中,Dongarra 率先利用多精度浮点算术加快了高精度解决方案的交付速度。这项成果已经在机器学习应用中发挥重要作用,以近期在 HPL-AI 基准测试中的表现为例,其帮助世界顶尖超级计算机实现了前所未有的性能水平。

批处理计算:Dongarra 开创了将大型密集矩阵计算(通常用于模拟、建模和数据分析)拆分为多个小型计算任务块的范例,这些块可以独立、并发计算。根据他在 2016 年发表的论文《GPU 上批处理矩阵乘法的性能、设计与自动调优》(Performance, design, and autotuning of batched GEMM for GPUs),Dongarra 领导了针对此类计算的 “批量基本线性代数子程序标准”(Batched BLAS Standard)开发,相关成果已经在 MAGMA 和 SLATE 软件库中得到应用。

在探索以上成果期间,Gongarra 以创新推动者的身份与众多同业人士开展国际合作,积极开发新技术以最大限度提高算法性能与可移植性,同时使用前沿成果有力保障数据计算能够给出可靠的结果。他主导的其他成果还包括消息传递接口(MPI)与性能 API(PAPI),后者提供的接口能够收集并整合来自异构系统各组件的性能指标。他协助建立的多项标准(包括 MPI、LINPACK 基准测试、全球超算五百强榜单等)也一直在为气象预测、气候变化、大型物理实验数据分析等计算任务提供有力支撑。

Dongarra 的贡献还成功构建起基础框架,帮助无数科学家和工程师在大数据分析、医疗保健、可再生能源、气象预测、基因组学及经济学等领域取得重要发现,进而构建起足以改变游戏规则的重大创新。Dongarra 的工作还极大推动了计算机架构的跨越式发展,燃起了计算机图形学与深度学习革命的燎原之火。

Dongarra 的主要贡献是建立起开源软件库及标准,其采用线性代数作为中间语言,可为各类应用程序所广泛使用。他的开源软件库能够顺利运行在单处理器、并行计算机、多核节点以及多 GPU 节点之上。Dongarra 还在库中引入众多重要创新,包括自动调优、混合精度算术及批处理计算等。

作为高性能计算先驱,Dongarra 致力于说服硬件供应商优化计算方法,并引领软件开发者在工作中使用他编写的开源库。最终,他的努力成功让基于线性代数的软件库在高性能科学与工程计算中得到普及,相关负载遍布从笔记本电脑到超级计算机的各类平台。这些库成为高性能计算发展中的重要基础,也推动着愈发强大的计算机攻克一个又一个极具挑战的计算难题。

目录
相关文章
|
机器学习/深度学习 人工智能 并行计算
超算榜单TOP500创始人之一Jack Dongarra荣获图灵奖!高性能计算领域首次得奖
超算榜单TOP500创始人之一Jack Dongarra荣获图灵奖!高性能计算领域首次得奖
103 0
|
25天前
|
存储 人工智能 弹性计算
阿里云弹性计算(ECS)提供强大的AI工作负载平台,支持灵活的资源配置与高性能计算,适用于AI训练与推理
阿里云弹性计算(ECS)提供强大的AI工作负载平台,支持灵活的资源配置与高性能计算,适用于AI训练与推理。通过合理优化资源分配、利用自动伸缩及高效数据管理,ECS能显著提升AI系统的性能与效率,降低运营成本,助力科研与企业用户在AI领域取得突破。
45 6
|
1月前
|
存储 人工智能 调度
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
1月前
|
存储 人工智能 大数据
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
1月前
|
存储 人工智能 弹性计算
对话阿里云吴结生:AI时代,云上高性能计算的创新发展
在阿里云智能集团副总裁,弹性计算产品线负责人、存储产品线负责人 吴结生看来,如今已经有很多行业应用了高性能计算,且高性能计算的负载正呈现出多样化发展的趋势,“当下,很多基础模型的预训练、自动驾驶、生命科学,以及工业制造、半导体芯片等行业和领域都应用了高性能计算。”吴结生指出。
|
1月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置选项,包括CPU+GPU、CPU+FPGA等组合,支持高性能计算需求。本文汇总了阿里云GPU服务器的价格信息,涵盖NVIDIA A10、V100、T4、P4、P100等多款GPU卡,适用于人工智能、机器学习和深度学习等场景。详细价格表和实例规格见文内图表。
182 0
|
4月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多样化的选择,包括CPU+GPU、CPU+FPGA等多种配置,适用于人工智能、机器学习和深度学习等计算密集型任务。其中,GPU服务器整合高性能CPU平台,单实例可实现最高5PFLOPS的混合精度计算能力。根据不同GPU类型(如NVIDIA A10、V100、T4等)和应用场景(如AI训练、推理、科学计算等),价格从数百到数千元不等。详情及更多实例规格可见阿里云官方页面。
282 1
|
6月前
|
存储 弹性计算 网络协议
阿里云hpc8ae服务器ECS高性能计算优化型实例性能详解
阿里云ECS的HPC优化型hpc8ae实例搭载3.75 GHz AMD第四代EPYC处理器,配备64 Gbps eRDMA网络,专为工业仿真、EDA、地质勘探等HPC工作负载设计。实例提供1:4的CPU内存配比,支持ESSD存储和IPv4/IPv6,操作系统限于特定版本的CentOS和Alibaba Cloud Linux。ecs.hpc8ae.32xlarge实例拥有64核和256 GiB内存,网络带宽和eRDMA带宽均为64 Gbit/s。适用于CFD、FEA、气象预报等场景。
|
6月前
|
存储 弹性计算 网络协议
阿里云高性能计算HPC优化实例商业化发布详解
基于云的高性能计算(Cloud HPC),与传统HPC相比更加灵活、高效。
|
7月前
|
存储 机器学习/深度学习 网络协议
阿里云高性能计算实例规格族有哪些?各自特点、适用场景介绍
阿里云高性能计算是的阿里云服务器ECS的架构之一,高性能计算实例规格族主要应用于各种需要超高性能、网络和存储能力的应用场景,例如人工智能、机器学习、科学计算、地质勘探、气象预报等场景。高性能计算实例规格族有高性能计算优化型实例规格族hpc8ae、高性能计算优化型实例规格族hpc7ip、计算型超级计算集群实例规格族sccc7等。下面是阿里云高性能计算实例规格族特点、适用场景介绍。
阿里云高性能计算实例规格族有哪些?各自特点、适用场景介绍

热门文章

最新文章

下一篇
DataWorks