2017年4月11日晚,在西安举行的架构体系的顶级会议ASPLOS(面向编程语言和操作系统的架构支持会议,Architectural Support for Programming Languages and Operating Systems)公布了最佳论文、最有影响力论文和 Test of Time 几项大奖。
ASPLOS(编程语言和操作系统的体系结构支持会议)是ACM开办的一个以体系结构为核心内容的多学科会议,其研究领域跨越硬件、体系结构、编译器、编程语言、操作系统、网络和应用,尤其关注这些学科间的交叉性研究课题。
大会上的研究可能针对不同的目标,如性能、能耗和热效率(thermal efficiency),弹性(resiliency),安全性和可持续性。随着登纳德缩放定律(Dennard scaling)的结束,大数据的爆炸性增长,规模从超低功耗可穿戴设备到百万兆级的并行计算和云计算,对可持续发展的需求以及越来越多的以人为中心的应用,这种跨部门研究的重要性不断增长 。
2017 ASPLOS 在中国西安举办,中国科学院计算技术研究所研究员陈云霁担任大会主席。
本次大会收到320篇论文投稿,被接收论文56篇,这已经是接收数量最高的一年,去年是53篇,前年只有48篇。
最佳论文 、最有影响力论文
本年度的ASPLOS共评出两篇最佳论文:
第一篇:《NUMA 架构的黑箱并发数据结构》(Black-box Concurrent Data Structures for NUMA Architectures)
摘要
高性能服务器是非均匀内存访问(NUMA)机器。为了充分利用这些机器,程序员需要有支持 NUMA 性能工件的高效的并发(concurrent)数据结构。我们提出了节点复制方法(Node Replication,NR),这是一种用于获取这种数据结构的黑箱方法。NR 采用任意的序列数据结构,并自动将其转换为满足线性化、支持 NUMA 的并发数据结构。使用 NR 不需要具备并行数据结构设计方面的专业知识,因此不会产生并发上的错误。NR 从两个学科中吸取了灵感:共享内存算法和分布式系统。简而言之,NR 实现了一个支持 NUMA 的共享日志,然后使用日志在 NUMA 的各个节点间复制统一的数据结构。NR 最适用于竞争的(contended)数据结构,处理这种数据时性能可以超出无锁(lock-free)算法 3.1 倍,超出锁定解决方案(lock-based solutions)30 倍。为了展示在实际应用程序中使用 NR 的好处,我们将 NR 应用于内存存储系统 Redis 数据结构。结果 NR 相比其他方法最高达到了 14 倍。NR 的成本是日志和副本需要的额外内存。
第二篇: Determining Application-specific Peak Power and Energy Requirements for Ultra-low Power Processors
摘要
许多新兴的应用,如IoT,可穿戴式应用,可植入物和传感器网络都受到电力和能源约束。这些应用依赖于超低功耗处理器。当下,超低功耗处理器已经迅速成为生产得最多的处理器类型。在这些应用所使用的超低功耗嵌入式系统中,峰值功率和能量要求是确定系统关键特性的主要因素,如尺寸,重量,成本和寿命。
虽然这些系统的功率和能源需求往往是特定于应用的,但传统的峰值功率和能量评估技术无法准确地限制在处理器上运行的应用程序的功率和能量需求,从而导致过度配置,进而增加系统体积和重量。
在本文中,我们提出了一种自动化技术,可在嵌入式系统中执行应用程序和超低功耗处理器的硬件 - 软件协同分析,以确定针对应用的峰值功率和能量要求。与传统技术相比,我们的技术提供比传统技术更准确,更紧密的界限(bounds),用于确定峰值功率和能量需求,相比传统的基于分析和保护带(profiling and guardbanding)的方法,平均报告峰值功率降低15%,峰值能量降低17%。与一种基于激进压力标记( aggressive stressmark-based)的方法相比,我们的技术报告的功率和能量平均分别下降了26%和26%。此外,与传统方法不同,我们的技术报告了与应用程序输入集无关的峰值功率和能量的保证范围。可以利用峰值功率和能量的更紧密的界限来减小系统的体积,重量和成本。
本届大会的最有影响力论文,归属于发表于2002年的《Automatically characterizing large scale program behavior》。
下载地址:https://cseweb.ucsd.edu/~calder/papers/ASPLOS-02-SimPoint.pdf
另外,SIGMOBILE的 Test of time Award 一般只颁给 SIGMOBILE 旗下的会议论文,今年颁给了 ASPLOS 2002 发表的《Energy-Efficient Computing for Wildlife Tracking:Designing Tradeoffs and Early Experiences with ZabraNet》。
中科院计算所研究员包云岗在微信朋友圈介绍说,经过10年以上时间考验的“Test-of-Time Award”颁给了 2002 年发表的 SimPoint;普林斯顿大学在 2002 年的 ASPLOS 文章神奇地获得了 ACM SIGMOBILE 的 2017 年度“Test-of-Time Award”,这篇文章开创了使用无线传感网跟踪野生动物的新应用模式,迄今引用已超过 3000 次。
http://www.princeton.edu/~mrm/asplos-x_annot.pdf
阿里周靖人主旨演讲:大数据分析与阿里云智能
大会主旨演讲部分,阿里巴巴副总裁、阿里云首席科学家周靖人用英语发表演讲,分享了阿里云的技术细节。以下是新智元根据速记的整理。
作为中国最大的云服务提供商,阿里巴巴云已经成为世界上增长最快的云计算平台之一。在这次演讲中,周靖人介绍了阿里巴巴云的大数据和 AI 计算平台,以及其中广泛的产品和服务,这些都让阿里能够实现快速高效的大数据开发和智能分析技术。还有底层计算基础设施,它们支持各种计算方案,包括批量,交互式,流计算和图计算,以及异构云规模数据中心的大规模机器学习。周靖人还介绍了几个大数据产品,如基于规则的引擎,推荐系统,BI工具等。阿里云平台不仅支持阿里巴巴的内部业务,还为企业客户提供的服务。
周靖人在演讲中首先介绍了阿里云规模的计算基础架构,在底层,阿里云拥有数万台机器以及大量的数据中心,分布在全国乃至世界各地。这一架构的顶层是各种资源管理系统,它们对资源进行管理和调度,支持广泛的计算环境。
各大公司的计算架构都很类似,但是阿里云的特色在于架构间各种资源是共享的,并且,由于是自建系统(home built system),系统在调度和部署时也会便利很多。
阿里云的数据质量监测系统
周靖人介绍说,当数据进入时,通常很“脏”,必须对数据集进行把控,所以阿里云有一个非常复杂的数据质量监控工具来监控数据生命周期,以及这一周期数据的质量。
“当你改变数据和数据属性,研究它的变化并进行规模化时,会引入一些异常,所以这一工具允许人们定义什么是正确的数据属性。”周靖人说。
阿里还有一个系统在后台连续监控数据集,这样就可以保证数据集是正常分配的。当后台通知数据时具有一定的规模,在系统中可能有一种学习类型的阈值,会把消息通知到数据所有者。这样就会得到一个非常紧密的封闭式监控系统,可以尽快捕获任何种类的异常行为。
计算模型图
阿里云机器学习平台 PAI
阿里云机器学习平台是一个大型机器学习平台。它首先是一个云计算平台,所有的训练,一切都可以在云中完成。 除此之外,这个平台还提供了图形界面(graphic interface),让人们能够将大数据分析与机器学习无缝整合。而在经历了一系列的分析以后,就会生成模型,这就是离线的训练阶段。在训练完成后,还必须做推理,服务模型,并且要学习,接受请求,并使用模型来开发,推断数据。
研究挑战
周靖人最后谈了 ASPLOS 研究社区面临的一些研究挑战,其中一个是对大数据分析有很大的需求。他以阿里数据中心支持实际业务为例,讲了数据中心必须支持广泛的计算场景,不能只将一个硬件分配到一个计算场景,必须考虑到这个硬件同时也会应用的其他计算场景。当时,为了需求,他们必须以 streamline 的方式将一种计算机转变(transform)为另一种计算机,随后自然就要需要应对异构硬件的问题。周靖人说,现在,阿里可以说是有了很多机器学习硬件,还有一些专用的处理器。
另一个挑战是算法是不断变化的。如果针对某个问题开发了一个特定的芯片或解决方案,解决方案和算法会随着时间的推移而改变,这样就会开发出很多特定的芯片和解决方案,然后就必须应对新的指令集,并在这么多不同的芯片上创造生态系统。
周靖人说,这些都是非常有趣的挑战,并号召研究人员多多交流学习。他说,事实上,做研究系统的人应该更多地从新人那里学习,融入研究社区可以发现自己想以怎样的方式参与硬件设计,参与为某种计算场景做架构支持的项目当中。
文章出处http://it.sohu.com/20170413/n488171048.shtml