
Spark SQL向量化执行引擎框架Gluten-Velox在AArch64使能和优化
Apache Spark是当前流行的开源数据处理引擎,Spark SQL为用户提供可靠的查询计算解决方案。近期,Gluten项目作为基于Apache Arrow的原生SQL引擎正式亮相,旨在增强Spark SQL计算性能。与此同时,多个向量化SQL引擎和更加活跃的开源社区也纷纷涌现。其中Velox项目尤为引人注目,它提供了向量化数据库加速库。本议题简要介绍了Gluten-Velox框架的概况和原理,同步Gluten-Velox社区在AArch64平台上的使能状态,并通过一个 Velox的优化案例,展示此Spark SQL向量化执行引擎框架在AArch64上的潜力。

Perf Arm SPE介绍与使用
SPE是Armv8.2引入一种性能剖析机制,可以提供更加细节的CPU运行时采样信息。本次分享主要介绍如何在倚天710平台上利用Arm SPE特性定位伪共享问题、分析内存访问、分析指令延时以及监控访存延时等功能。

高效可靠的处理器微体系结构性能测量技术
在Arm成熟的软硬件生态支持下,Arm架构处理器走进数据中心。应用的跨平台迁移及处理器设计研发均依赖于处理器微体系结构的性能数据,准确、可靠的性能测量是性能工程的重要基础。本次演讲围绕性能测量,着重分享了两项工作。第一项工作是关于如何高效地复用硬件性能计数器进行可靠测量,此项工作主要针对现有工具在复用硬件性能计数器测量时存在的低效行为,通过研究Linux内核性能事件的调度机制,提出一种自适应的性能事件分组方法提高性能计数器的复用效率。第二项工作是关于Arm架构处理器实时内存带宽的通用测量方法,Arm架构的灵活性赋予了各硬件厂商定制处理器的能力。此项工作探索了Arm架构下实时内存带宽测量通用方案的可能性。

PAS工具分享 - FrameScope与RTRadar
云计算服务的主营业务之一便是资源售卖,云厂商会采购不同平台、不同型号的服务器,通过池化技术整合机器资源,再将不同规格的资源弹性售卖给开发者。对开发者而言,是否能够在这众多的云服务器产品中选择出能运行目标程序最佳性能的产品,同时能够在此基础上进一步优化程序性能从而充分利用云资源的性能,是提升上云性价比的第一要务,而FrameScope可以协助用户快速应对上述场景。在应用性能评估中,事务执行延迟是重要指标之一,随着分布式架构的广泛应用,厂商可通过分布式链路跟踪技术(例如Dapper)将延迟瓶颈定位到单节点上(物理机、虚拟机、容器),然而深入分析单节点上复杂的事务延迟时,现有工具往往显得不足。针对以上问题,阿里云自研了一套工具,通过采集事务关键事件以及内核系统事件,重建事务执行过程、分析依赖关系、量化各影响因素对整体延迟的贡献占比,从而定位延迟瓶颈。

AArch64架构调用链性能数据采集原理
调用链 (Callchain) 是软硬件事件上下文信息之一,对性能优化和故障排具有非常重要的作用。如著名的火焰图 (Flamegraph) 就是对调用链信息汇总统计和可视化的结果。但是在调用链收集的过程中,工程师往往因为不了解底层的采集原理导致调用链收集不完整,采集开销不可控等问题。本议题核心介绍了在AArch64架构下调用链采集的原理,比较它们之间的不同和阐述适用场景。同时对Linux内核态和eBPF调用链采集做了一些简单介绍。

阿里巴巴生态应用在Arm平台性能优化实践
Arm作为最为普遍使用的架构,吸引了广大开发者的兴趣。最近阿里巴巴生态核心应用在Arm平台上部署后显示较大的性能差异,通过分析发现主要是CPU前端瓶颈,因此我们在JVM层面进行了针对性优化,提出的代码压缩、热代码集中分配等技术方案在落地后进一步完善性能,给后续更大规模的部署提供了信心;同时,Arm平台也拥有丰富的性能分析工具,比如CoreSight提供了指令流分析的能力,基于这些信息阿里云发现了JVM中编译阈值对profile采集准确性的影响,针对性调整后达到了更佳的性能效果。

为RTP-LLM提供Arm CPU后端,助力Arm AI软件生态持续发展
随着大语言模型(LLM)的普及与应用,AI计算需求快速增长。许多LLM模型运行在基于GPU的硬件上,而随着Arm架构不仅在边缘设备,而且在数据中心领域也愈发流行,如何让RTP-LLM(实时推理框架)有效支持Arm CPU平台变得尤为重要。通过优化LLM在Arm平台的推理性能,可以进一步提升功耗效率和模型部署的灵活性。

阿里云 Confidential Al 最佳实践
为缓解用户对 AI 模型上云产生的隐私与合规问题,阿里云 Confidential AI(CAI)实现了一种覆盖模型数据生命周期的端到端通用框架,揭示了机密计算在 AI 系统安全方面的重要价值。未来,CAI 将利用远程证明体系提供基于软件供应链的可验证代码透明度,为用户提供独立验证 CAI 隐私和安全保证的能力。

OS 升级迭代与向前向后兼容问题
操作系统升级迭代过程中,如何保障不影响用户的业务系统,如何让“更新"对用户透明,又能持续增强系统的能力。本次 MeetUp 上,方德分享了他们的方案。

阿里云操作系统迁移最佳实践
针对 OS 迁移升级,龙蜥社区及其理事长单位阿里云均推出了相应的一站式解决方案。通过迁移平台提供的操作系统迁移能力,覆盖操作系统迁移全流程,确保广大用户高效、有保障的升级到龙蜥/阿里云操作系统。

操作系统生态兼容与创新的平衡艺术
操作系统生态的发展离不开兼容性与创新的平衡,这是一项复杂的技术挑战。版本隔离、符号版本化等技术解决了版本迭代中的兼容性问题,保障新旧软件共存;通过同源异构和仿真执行,实现了多平台的统一性;通过兼容层和跨平台框架等技术实现了多系统融合,突破了操作系统之间的隔阂。这些技术的实现不仅依赖于工程能力,更需要面向未来的生态思维。兼容性是基础,创新是动力,平衡是关键。唯有技术与生态协同发展,才能构建稳定且充满活力的操作系统生态。

龙蜥社区漏洞管理治理策略与实践
开源软件漏洞治理是构建龙蜥操作系统安全基石的重要一环。本次分享聚焦龙蜥社区的安全漏洞管理体系及其治理策略,包括漏洞情报感知收集、威胁分析与风险评估、漏洞修复及公告披露等流程。同时简单介绍社区在漏洞治理协作上的初步实践,探讨社区漏洞治理未来的优化方向。

开源社区漏洞治理策略与实践
开源软件供应链非常复杂,存在大量的攻击点,谷歌和微软分别给出了开源供应的 SLSA 框架和 S2C2F 框架,里面存在着漏洞攻击、投毒、过程篡改等风险,加之代码开源漏洞更加透明且容易获取。本次分享聚焦供应链漏洞治理,通过成分分析建立 BOM 体系,识别社区研发过程各个环节风险,通过工程能力提升社区漏洞感知、漏洞可达、漏洞修复,E2E 处理漏洞能力。

车载操作系统信息安全架构
随着汽车产业智能化、网联化发展,其安全性与隐私保护方面的问题也日益凸显。 车载操作系统作为汽车产业智能化核心,安全更是重中之重。中兴通讯打造的 safetylinux 操作系统,提出了包括安全启动、安全通信、安全存储、安全诊断和入侵检测等要素在内的车载操作系统信息安全架构,为汽车产业的信息安全保驾护航。

阿里云 Confidential AI 最佳实践
为缓解用户对 AI 模型上云产生的隐私与合规问题,阿里云Confidential AI(CAI)实现了一种覆盖模型数据生命周期的端到端通用框架,揭示了机密计算在AI系统安全方面的重要价值。未来,CAI 将利用远程证明体系提供基于软件供应链的可验证代码透明度,为用户提供独立验证 CAI 隐私和安全保证的能力。

电信主机安全检测技术
为保障 5G 网络能够有效抵御严重网络攻击,符合国家关键基础设施防护要求,需要对 5G 主机系统的运行安全进行实时监测和风险处置。中兴通讯结合融合了安全设计、主动防御和 AI 等技术,将传统以查病毒、补漏洞为主的黑名单被动防御机制,革新为基于安全设计的白名单主动防御机制。
Java 内存管理与优化:掌控堆与栈,雕琢高效代码
Java内存管理与优化是提升程序性能的关键。掌握堆与栈的运作机制,学习如何有效管理内存资源,雕琢出更加高效的代码,是每个Java开发者必备的技能。
《C 语言函数指针:解锁灵活编程的强大工具》
《C 语言函数指针:解锁灵活编程的强大工具》介绍了函数指针在 C 语言中的应用,通过实例解析其在程序设计中的灵活性和强大功能,帮助读者掌握高效编程技巧。
宏任务和微任务在浏览器渲染过程中的执行顺序
宏任务和微任务是浏览器事件循环中的两种任务类型。宏任务包括整体代码块、setTimeout等,微任务有Promise.then、MutationObserver等。每个宏任务执行完毕后,会先执行完所有微任务,再进行下一轮渲染或执行下一个宏任务。
手把手教学攻略:在Anolis OS上部署OpenVINO深度学习模型
Anolis OS 作为国内首个正式提供 OpenVINO 开发包和镜像的服务器端操作系统,推动国内 AI 推理生态和能力的升级。

龙蜥操作系统
龙蜥社区(OpenAnolis)是面向国际的 Linux 服务器操作系统开源根社区及创新平台,秉承“平等、开放、协作、创新”的原则,理事会由阿里云、统信软件、龙芯、Arm 、Intel 等 24 家国内外头部企业共同组成,有超过 1000 家来自芯片厂商、软件厂商、整机厂商、操作系统厂商等覆盖操作系统全产业链的合作伙伴参与生态共建。