体系结构顶会 ASPLOS 2017 最佳论文出炉,阿里云周靖人主旨演讲

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 2017年4月11日晚,在西安举行的架构体系的顶级会议ASPLOS(面向编程语言和操作系统的架构支持会议,Architectural Support for Programming Languages and Operating Systems)公布了最佳论文、最有影响力论文和 Test of Time 几项大奖。

2017年4月11日晚,在西安举行的架构体系的顶级会议ASPLOS(面向编程语言和操作系统的架构支持会议,Architectural Support for Programming Languages and Operating Systems)公布了最佳论文、最有影响力论文和 Test of Time 几项大奖。

  ASPLOS(编程语言和操作系统的体系结构支持会议)是ACM开办的一个以体系结构为核心内容的多学科会议,其研究领域跨越硬件、体系结构、编译器、编程语言、操作系统、网络和应用,尤其关注这些学科间的交叉性研究课题。

  

  大会上的研究可能针对不同的目标,如性能、能耗和热效率(thermal efficiency),弹性(resiliency),安全性和可持续性。随着登纳德缩放定律(Dennard scaling)的结束,大数据的爆炸性增长,规模从超低功耗可穿戴设备到百万兆级的并行计算和云计算,对可持续发展的需求以及越来越多的以人为中心的应用,这种跨部门研究的重要性不断增长 。

  2017 ASPLOS 在中国西安举办,中国科学院计算技术研究所研究员陈云霁担任大会主席。

  

  本次大会收到320篇论文投稿,被接收论文56篇,这已经是接收数量最高的一年,去年是53篇,前年只有48篇。

  最佳论文 、最有影响力论文

  本年度的ASPLOS共评出两篇最佳论文:

  

  第一篇:《NUMA 架构的黑箱并发数据结构》(Black-box Concurrent Data Structures for NUMA Architectures)

  

摘要

  高性能服务器是非均匀内存访问(NUMA)机器。为了充分利用这些机器,程序员需要有支持 NUMA 性能工件的高效的并发(concurrent)数据结构。我们提出了节点复制方法(Node Replication,NR),这是一种用于获取这种数据结构的黑箱方法。NR 采用任意的序列数据结构,并自动将其转换为满足线性化、支持 NUMA 的并发数据结构。使用 NR 不需要具备并行数据结构设计方面的专业知识,因此不会产生并发上的错误。NR 从两个学科中吸取了灵感:共享内存算法和分布式系统。简而言之,NR 实现了一个支持 NUMA 的共享日志,然后使用日志在 NUMA 的各个节点间复制统一的数据结构。NR 最适用于竞争的(contended)数据结构,处理这种数据时性能可以超出无锁(lock-free)算法 3.1 倍,超出锁定解决方案(lock-based solutions)30 倍。为了展示在实际应用程序中使用 NR 的好处,我们将 NR 应用于内存存储系统 Redis 数据结构。结果 NR 相比其他方法最高达到了 14 倍。NR 的成本是日志和副本需要的额外内存。

  

  第二篇: Determining Application-specific Peak Power and Energy Requirements for Ultra-low Power Processors

  

摘要

  许多新兴的应用,如IoT,可穿戴式应用,可植入物和传感器网络都受到电力和能源约束。这些应用依赖于超低功耗处理器。当下,超低功耗处理器已经迅速成为生产得最多的处理器类型。在这些应用所使用的超低功耗嵌入式系统中,峰值功率和能量要求是确定系统关键特性的主要因素,如尺寸,重量,成本和寿命。

  虽然这些系统的功率和能源需求往往是特定于应用的,但传统的峰值功率和能量评估技术无法准确地限制在处理器上运行的应用程序的功率和能量需求,从而导致过度配置,进而增加系统体积和重量。

  在本文中,我们提出了一种自动化技术,可在嵌入式系统中执行应用程序和超低功耗处理器的硬件 - 软件协同分析,以确定针对应用的峰值功率和能量要求。与传统技术相比,我们的技术提供比传统技术更准确,更紧密的界限(bounds),用于确定峰值功率和能量需求,相比传统的基于分析和保护带(profiling and guardbanding)的方法,平均报告峰值功率降低15%,峰值能量降低17%。与一种基于激进压力标记( aggressive stressmark-based)的方法相比,我们的技术报告的功率和能量平均分别下降了26%和26%。此外,与传统方法不同,我们的技术报告了与应用程序输入集无关的峰值功率和能量的保证范围。可以利用峰值功率和能量的更紧密的界限来减小系统的体积,重量和成本。

  本届大会的最有影响力论文,归属于发表于2002年的《Automatically characterizing large scale program behavior》。

  

  下载地址:https://cseweb.ucsd.edu/~calder/papers/ASPLOS-02-SimPoint.pdf

  

  另外,SIGMOBILE的 Test of time Award 一般只颁给 SIGMOBILE 旗下的会议论文,今年颁给了 ASPLOS 2002 发表的《Energy-Efficient Computing for Wildlife Tracking:Designing Tradeoffs and Early Experiences with ZabraNet》。

  

  中科院计算所研究员包云岗在微信朋友圈介绍说,经过10年以上时间考验的“Test-of-Time Award”颁给了 2002 年发表的 SimPoint;普林斯顿大学在 2002 年的 ASPLOS 文章神奇地获得了 ACM SIGMOBILE 的 2017 年度“Test-of-Time Award”,这篇文章开创了使用无线传感网跟踪野生动物的新应用模式,迄今引用已超过 3000 次。

  

  http://www.princeton.edu/~mrm/asplos-x_annot.pdf

  阿里周靖人主旨演讲:大数据分析与阿里云智能

  大会主旨演讲部分,阿里巴巴副总裁、阿里云首席科学家周靖人用英语发表演讲,分享了阿里云的技术细节。以下是新智元根据速记的整理。

  

  作为中国最大的云服务提供商,阿里巴巴云已经成为世界上增长最快的云计算平台之一。在这次演讲中,周靖人介绍了阿里巴巴云的大数据和 AI 计算平台,以及其中广泛的产品和服务,这些都让阿里能够实现快速高效的大数据开发和智能分析技术。还有底层计算基础设施,它们支持各种计算方案,包括批量,交互式,流计算和图计算,以及异构云规模数据中心的大规模机器学习。周靖人还介绍了几个大数据产品,如基于规则的引擎,推荐系统,BI工具等。阿里云平台不仅支持阿里巴巴的内部业务,还为企业客户提供的服务。

  

  周靖人在演讲中首先介绍了阿里云规模的计算基础架构,在底层,阿里云拥有数万台机器以及大量的数据中心,分布在全国乃至世界各地。这一架构的顶层是各种资源管理系统,它们对资源进行管理和调度,支持广泛的计算环境。

  各大公司的计算架构都很类似,但是阿里云的特色在于架构间各种资源是共享的,并且,由于是自建系统(home built system),系统在调度和部署时也会便利很多。

  

  阿里云的数据质量监测系统

  周靖人介绍说,当数据进入时,通常很“脏”,必须对数据集进行把控,所以阿里云有一个非常复杂的数据质量监控工具来监控数据生命周期,以及这一周期数据的质量。

  “当你改变数据和数据属性,研究它的变化并进行规模化时,会引入一些异常,所以这一工具允许人们定义什么是正确的数据属性。”周靖人说。

  阿里还有一个系统在后台连续监控数据集,这样就可以保证数据集是正常分配的。当后台通知数据时具有一定的规模,在系统中可能有一种学习类型的阈值,会把消息通知到数据所有者。这样就会得到一个非常紧密的封闭式监控系统,可以尽快捕获任何种类的异常行为。

  

  计算模型图

  

  阿里云机器学习平台 PAI

  阿里云机器学习平台是一个大型机器学习平台。它首先是一个云计算平台,所有的训练,一切都可以在云中完成。 除此之外,这个平台还提供了图形界面(graphic interface),让人们能够将大数据分析与机器学习无缝整合。而在经历了一系列的分析以后,就会生成模型,这就是离线的训练阶段。在训练完成后,还必须做推理,服务模型,并且要学习,接受请求,并使用模型来开发,推断数据。

  

  研究挑战

  周靖人最后谈了 ASPLOS 研究社区面临的一些研究挑战,其中一个是对大数据分析有很大的需求。他以阿里数据中心支持实际业务为例,讲了数据中心必须支持广泛的计算场景,不能只将一个硬件分配到一个计算场景,必须考虑到这个硬件同时也会应用的其他计算场景。当时,为了需求,他们必须以 streamline 的方式将一种计算机转变(transform)为另一种计算机,随后自然就要需要应对异构硬件的问题。周靖人说,现在,阿里可以说是有了很多机器学习硬件,还有一些专用的处理器。

  另一个挑战是算法是不断变化的。如果针对某个问题开发了一个特定的芯片或解决方案,解决方案和算法会随着时间的推移而改变,这样就会开发出很多特定的芯片和解决方案,然后就必须应对新的指令集,并在这么多不同的芯片上创造生态系统。

  周靖人说,这些都是非常有趣的挑战,并号召研究人员多多交流学习。他说,事实上,做研究系统的人应该更多地从新人那里学习,融入研究社区可以发现自己想以怎样的方式参与硬件设计,参与为某种计算场景做架构支持的项目当中。

文章出处http://it.sohu.com/20170413/n488171048.shtml

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
6月前
|
机器学习/深度学习 人工智能 算法
【AAAI 2024】再创佳绩!阿里云人工智能平台PAI多篇论文入选
阿里云人工智能平台PAI发表的多篇论文在AAAI-2024上正式亮相发表。AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。论文成果是阿里云与浙江大学、华南理工大学联合培养项目等共同研发,深耕以通用人工智能(AGI)为目标的一系列基础科学与工程问题,包括多模态理解模型、小样本类增量学习、深度表格学习和文档版面此次入选意味着阿里云人工智能平台PAI自研的深度学习算法达到了全球业界先进水平,获得了国际学者的认可,展现了阿里云人工智能技术创新在国际上的竞争力。
|
机器学习/深度学习 人工智能 安全
隐语团队研究成果再创佳绩,两篇论文分别被USENIX ATC'23和IJCAI'23接收!
隐语团队研究成果再创佳绩,两篇论文分别被USENIX ATC'23和IJCAI'23接收!
200 0
|
数据可视化 数据挖掘 大数据
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读(2)
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读
186 0
|
机器学习/深度学习 达摩院 算法
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读(1)
同济、阿里的CVPR 2022最佳学生论文奖研究了什么?这是一作的解读
108 0
|
机器学习/深度学习 人工智能 算法
国产AI框架支棱起来了!这所211高校凭昇思MindSpore连发10篇顶刊/顶会论文
国产AI框架支棱起来了!这所211高校凭昇思MindSpore连发10篇顶刊/顶会论文
175 0
|
机器学习/深度学习 人工智能 自然语言处理
CVPR 2021大奖公布!何恺明获最佳论文提名,代码已开源!
深度生成模型可以在高分辨率下进行逼真的图像合成。但对于许多应用来说,这还不够:内容创作还需要可控。虽然最近有几项工作研究了如何分解数据中的潜在变化因素,但它们大多在二维中操作,忽略了我们的世界是三维的。
CVPR 2021大奖公布!何恺明获最佳论文提名,代码已开源!
|
机器学习/深度学习 存储 人工智能
阿里云机器学习平台PAI论文入选国际顶会ASPLOS 2022
近日,阿里云机器学习PAI主导的论文《机器学习访存密集计算编译优化框架AStitch》入选国际顶会ASPLOS 2022,论文通过编译优化的手段来自动化地提高机器学习任务的执行效率。此次入选意味着阿里云机器学习平台PAI自研的深度学习编译优化系统达到了全球业界先进水平,获得了国际学者的认可,展现了中国机器学习系统技术创新在国际上的竞争力。
|
机器学习/深度学习 人工智能 自然语言处理
IJCAI 2021开幕:程序主席周志华揭晓热门研究主题,杰出论文等奖项出炉
从AI学术顶会IJCAI统计的这些数据中,洞见热门研究趋势。
220 0
IJCAI 2021开幕:程序主席周志华揭晓热门研究主题,杰出论文等奖项出炉
|
机器学习/深度学习 存储 分布式计算
阿里云飞天论文获国际架构顶会 ATC 2021最佳论文:全球仅三篇
近日,计算机系统结构国际顶级学术会议 USENIX ATC在线上举行。ATC 始办于1992年,是由USENIX组织的计算机系统领域的顶级会议,至今已成功举办31届,计算机系统领域中Oak语言(JAVA语言的前身)、QEMU、ZooKeeper等一系列有影响力的研究成果都在USENIXATC发表或公布。ATC 对论文要求极高,必须满足基础性贡献、前瞻性影响和坚实系统实现的要求,本次论文录取率仅为18%,全球仅选取3篇最佳论文。
1266 0
阿里云飞天论文获国际架构顶会 ATC 2021最佳论文:全球仅三篇
|
机器学习/深度学习 编解码 算法
44篇论文强势进击CVPR 2018,商汤科技的研究员都在做哪些研究?
机器之心走进商汤,尝试从 44 篇接收论文中找出商汤近期的主攻方向,分析公司为 3-5 年乃至更长期的发展进行了哪些战略技术储备,也观照 CVPR 会议,乃至视觉领域的关注点迁移趋势。同时我们采访了三位来自商汤入选本届 CVPR oral / spotlight 环节的论文作者,与他们谈了自己的研究,如何进行开发,以及对 CVPR 乃至 CVPR 之外整个视觉领域研究现状的看法。
209 0
下一篇
无影云桌面